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方 午 二 = 
腹 却 





Java 是 目前 用 户 最 多 、 使 用 范围 最 广 的 软件 开发 技术 之 一 。Java 的 
技术 体系 主要 由 文 撑 Java 程 序 运行 的 虚拟 机 、 提 供 各 开发 领域 接口 支持 
的 Java API、Java 编 程 语言 及 许多 第 三 方 Java 框 架 〈 如 Spring、Struts 等 ) 
构成 。 在 国内 ， 有 关 Java API、Java 语 言语 法 及 第 三 方 框 架 的 技术 资料 
和 书籍 非常 丰富 ， 相 比 之 下 ， 有 关 Java 虚 拟 机 的 资料 却 显得 异常 贫乏 。 











这 种 状况 在 很 大 程度 上 是 由 Java 开 发 技术 本 身 的 一 个 重要 优点 导致 
的 : 在 虚拟 机 层面 隐藏 了 底层 技术 的 复杂 性 以 及 机 器 与 操作 系统 的 差异 
性 。 运 行程 序 的 物理 机 器 的 情况 千差万别 ， 而 Java 虚 拟 机 则 在 千差万别 
的 物理 机 上 建立 了 统一 的 运行 平台 ， 实 现 了 在 任意 一 台 虚 拟 机 上 编译 的 
程序 都 能 在 任何 一 台 虚 拟 机 上 正常 运行 。 这 一 极 大 优势 使 得 Java 应 用 的 
开发 比 传统 C/C++ 应 用 的 开发 更 高 效 和 快捷 ， 程 序 员 可 以 把 主要 精力 集 
中 在 具体 业务 逻辑 上 ， 而 不 是 物理 硬件 的 兼容 性 上 。 在 一 般 情 况 下 ， 一 
个 程序 员 只 要 了 解 了 必要 的 Java API、Java 语 法 ， 以 及 学 习 适 当 的 第 三 
方 开发 框架 ， 就 已 经 基本 能 满足 日 常 开发 的 需要 了 ， 虚 拟 机 会 在 用 户 不 
知 不 觉 中 完成 对 硬件 平台 的 兼容 及 对 内 存 等 资源 的 管理 工作 。 因 此 ， 了 
解 虚 拟 机 的 运作 并 不 是 一 般 开 发 人 员 必 须 掌握 的 知识 。 





























然而 ， 凡 事 都 具备 两 面 性 。 随 着 Java 技 术 的 不 断 发 展 ， 它 被 应 用 于 
越 来 越 多 的 领域 之 中 。 其 中 一 些 领 域 ， 如 电力 、 金 融 、 通 信 等 ， 对 程序 








的 性 能 、 稳 定性 和 可 扩展 性 方面 都 有 极 高 的 要 求 。 程 序 很 可 能 在 10 个 人 
同时 使 用 时 完全 正常 ， 但 是 在 10000 个 人 同时 使 用 时 就 会 缓慢 、 死 锁 ， 
甚至 朋 溃 。 毫 无 疑问 ， 要 满足 10000 个 人 同时 使 用 需要 更 高 性 能 的 物理 
硬件 ， 但 是 在 绝 大 多 数 情况 下 ， 提 升 硬 件 效能 无 法 等 比例 地 提升 程序 的 
运作 性 能 和 并 发 能 力 ， 甚 至 可 能 对 程序 运作 状况 完全 没有 任何 改善 。 这 
里 面 有 Java 虚 拟 机 的 原因 : 为 了 达到 给 所 有 硬件 提供 一 致 的 虚拟 平 合 的 
目的 ， 牺 牲 了 一 些 与 硬件 相关 的 性 能 特性 。 更 重要 的 是 人 为 原因 : 如 果 
开发 人 员 不 了 解 虚拟 机 一 些 技术 特性 的 运行 原理 ， 就 无 法 写 出 最 适合 虚 
拟 机 运行 和 目 优 化 的 代码 。 








其 实 ， 目 前 商用 的 高 性 能 Java 虚 拟 机 都 提供 了 相当 多 的 优化 特性 和 
调节 手段 ， 用 于 满足 应 用 程序 在 实际 生产 环境 中 对 性 能 和 稳定 性 的 要 
求 。 如 果 只 是 为 了 入 门 学 习 ， 让 程序 在 上 自己 的 机 需 上 正常 运行 ， 那 么 这 
些 特性 可 以 说 是 可 有 可 无 的 ;， 如果 用 于 生产 开发 ， 尤 其 是 企业 级 生产 开 
发 ， 就 迫切 需要 开发 人 员 中 人 至少 有 一 部 分 人 对 虚拟 机 的 特性 及 调 市 方法 
有 共有 很 清晰 的 认识 ， 所 以 在 Java 开 及 体系 中 ， 对 架构 师 、 系 统 调 优 师 、 
高 级 程序 员 等 角色 的 需求 一 直 都 非常 大 。 学 习 虚 拟 机 中 各 种 自动 运作 特 
性 的 原理 也 成 为 了 Java 程 序 员 成 长 道路 上 必然 会 接触 到 的 一 读 。 本 书 可 
以 使 读者 以 一 种 相对 轻松 的 方式 学 习 虚 拟 机 的 运作 原理 ， 对 Java 程 序 员 
的 成 长 也 有 较 大 的 帮助 。 





第 2 版 与 第 1 版 的 区 别 





JDK 1.7 在 2011 年 7 月 28 日 正式 发 布 ， 相 对 于 2006 年 发 布 的 JDK 1.6， 
新 版 的 DK 有 了 许多 新 的 特性 和 改进 。 本 书 的 第 2 版 也 相应 地 进行 了 修 
改 和 升级 ， 把 讲解 的 技术 平台 从 JDK 1.6 提 升 至 JDK 1.7。 例 如 ， 增 加 了 
对 JDK 1.7 中 最 新 的 G1 收集 器 ， 以 及 JDK 1.7 中 JSR-292 
InvokeDynamic( 对 非 Java 语 言 的 调用 支持 的 分 析 讲 解 等 内 容 。 








在 第 1 版 出 版 后 ， 笔 者 收 到 了 许多 热心 读者 的 反馈 意见 ， 部 分 读者 
提出 OpenJDK 开 源 已 入， 第 1 版 却 很 少 有 直接 分 析 OpenJDK 源 码 的 内 
容 ， 有 点 “ 视 宝山 而 不 见 ” 的 感觉 。 因 此 ， 在 本 书 第 2 版 中 ， 笔 者 特别 加 
强 了 对 这 部 分 内 容 的 讲解 ， 其 中 在 第 1 章 中 就 介绍 了 如 何 分 析 、 调 试 
OpenJDK 源 码 等 。 在 本 书后 续 章 节 中 ， 不 少 关 于 功能 点 的 讲解 都 直接 使 
用 OpenJDK 中 的 HotSpot 源 码 或 者 JIT 编 译 器 生成 的 本 地 代码 作为 论据 。 














如 何 把 Java 虚 拟 机 原理 中 许多 理论 性 很 强 的 知识 、 特 性 应 用 于 实践 
开发 ， 是 本 书 贯 罕 始 终 的 主旨 。 由 于 笔者 希望 在 本 书 第 2 版 中 进一步 加 
强 知识 的 实践 性 ， 因 此 增加 了 许多 对 处 理 JVM 常 见 问 题 技能 的 讲解 ， 包 
括 如 何 分 析 GC 日 志 、 如 何 分 析 JIT 编 译 器 代码 优化 过 程 和 生成 代码 等 。 
并 且 ， 在 第 1 版 的 基础 上 ， 第 2 版 中 进一步 增加 了 大 干 处 理 JVM 问 题 的 实 
践 案例 供 读者 参考 。 





另外 ， 本 书 第 2 版 还 修正 了 第 1 版 中 多 处 错误 的 、 有 上 监 义 的 和 不 完整 
的 描述 。 有 关 勤 误 信 息 ， 可 以 参考 第 1 版 的 勤 误 页 面 
(http://icyfenix.iteye.com/blog/1119214) 。 


本 书面 癌 的 读者 


(1) 使 用 Java 撤 术 体系 的 中 、 高 级 开发 人 员 








Java 庶 拟 机 作为 中 、 高 级 开 用 人 员 必 须 修 炼 的 知识 ， 有 痢 较 高 的 学 
习 门 榄 ， 本 书 可 作为 学 习 虚 拟 机 的 优秀 教材 。 


(2) 系统 调 优 师 








系统 调 优 师 是 近 几 年 才 兴 起 的 职业 ， 本 书 中 的 大 量 案例 、 代 码 和 调 
优 实战 将 会 对 系统 调 优 师 的 日 常 工作 有 直接 的 帮助 。 





(3) 系统 架构 师 


保障 系统 的 性 能 、 并 发 和 伸缩 等 能 力 是 系统 架构 师 的 主要 职责 之 
一 ， 而 这 部 分 与 虚拟 机 的 运作 蜜 不 可 分 ， 本 书 可 以 作为 他 们 制定 应 用 系 
统 确 层 框 以 的 参考 资料 。 


如 何 阅读 本 书 


本 书 一 共 分 为 五 个 部 分 : 走 近 Java、 自 动 内 存 管理 机 制 、 虚 拟 机 执 
行 子 系统 、 程 序 编译 与 代码 优化 、 高 效 并 有 发。 各 部 分 基本 上 是 互相 独立 
的 ， 没 有 必然 的 前 后 依赖 关系 ， 读 者 可 以 从 任何 一 个 感 兴趣 的 专题 开始 
阅读 ， 但 是 每 个 部 分 中 的 各 个 章节 间 有 先后 顺序 。 





本 书 并 没有 假设 读者 在 Java 领 域 具备 很 专业 的 技术 水 平 ， 因 此 在 保 
证 逻辑 准确 的 前 提 下 ， 尽 量 用 通俗 的 语言 和 案例 讲述 虚拟 机 中 与 开发 的 
关系 最 为 密切 的 内 容 。 当 然 ， 学 习 虚 拟 机 技术 本 号 就 需要 读者 有 一 定 的 
基础 ， 且 本 书 的 读者 定位 是 中 、 高 级 程序 员 ， 因 此 本 书 假 设 读者 自己 了 
解 一 些 常用 的 开发 框架 、Java API 和 Java 语 法 等 基础 知识 。 











笔者 希望 读者 在 阅读 本 书 的 同时 ， 把 本 书 中 的 实践 内 容 杀 自 验 证 一 
裔 ， 其 中 用 到 的 代码 清单 可 以 从 华章 网 站 (http://www.hzbook.com) 下 
载 。 
语言 约定 

本 书 在 语言 和 技术 上 有 如 下 约定 : 


本 书 中 提 到 HotSpot、JRockit 虚 拟 机 、WebLogic 服 务 器 等 产品 的 所 


有 者 时 ， 仍 然 使 用 Sun 和 BEA 公 司 的 名 称 ， 实 际 上 ，BEA 和 Sun 分 别 于 
2008 年 和 2009 年 被 Oracle 公 司 收购 ， 现 在 已 经 不 存在 这 两 个 商标 了 ， 但 
训 无 疑问 的 是 ， 它 们 都 是 在 Java 领 域 中 做 出 过 章 越 贡献 的 、 值 得 程序 员 


纪念 的 公司 。 

















JDK 从 1.5 版 本 开始 ， 在 官方 的 正式 文档 与 宣传 资料 中 已 经 不 再 使 用 
类 似 "JDK 1.5" 的 名 称 ， 只 有 程序 员 内 部 使 用 的 开发 版 本 写 《Developer 
Version， 例 如 java-version 的 输出 ) 才 继续 沿用 1.5、1.6 和 1.7 的 版 本 号 ， 
而 公开 版 本 号 〈Product Version) 则 改 为 JDK 5、JDK 6 和 JDK 7 的 命名 
方式 ， 为 了 行文 一 致 ， 本 书 所 有 场合 统一 采用 开发 版 本 号 的 命名 方式 。 











由 于 版 面 关 系 ， 本 书 中 的 许多 示例 代码 都 没有 遵循 最 优 的 代码 编号 
风格 ， 如 使 用 的 流 没 有 关闭 流 等 ， 请 读者 在 阅读 时 注意 这 一 点 。 


如 果 没 有 特殊 说 明 ， 本 书 中 所 有 讨论 都 是 以 Sun JDK 1.7 为 技术 平台 
的 。 不 过 如 果 有 某 个 特性 在 各 个 版 本 间 的 变化 较 大 ， 一 般 都 会 说 明 它 在 
各 个 版 本 间 的 差异 。 


本 书 的 第 一 部 分 为 后 文 的 讲解 建立 了 展 好 的 基础 。 尽 管 了 解 Java 技 
术 的 来 龙 去 脉 ， 以 及 编译 自己 的 OpenJDK 对 于 读者 理解 Java 虚 拟 机 并 不 
是 必需 的 ， 但 是 这 些 准备 过 程 可 以 为 走 近 Java 技 术 和 Java 虚 拟 机 提供 很 
好 的 引导 。 第 一 部 分 只 有 第 1 章 : 








第 1 章 ”介绍 了 Java 技 术 体 系 的 过 去 、 现 在 和 未 来 的 一 些 发 展 趋 
势 ， 并 介绍 了 如 何 独立 地 编译 一 个 OpenJDK 7。 


第 二 部 分 “ 目 动 内 存 管 理 机 制 


因为 程序 员 把 内 存 控制 的 权力 交 给 了 Java 虚 拟 机 ， 所 以 可 以 在 编码 
的 时 候 部 受 目 动 内 存 管理 的 诸多 优势 ， 不 过 也 正 是 这 个 原因 ， 一 旦 出 现 
内 存 泄 漏 和 洲 出 方面 的 问题 ， 如 果 不 了 解 虚 拟 机 是 怎样 使 用 内 存 的 ， 那 
么 排便 错误 将 会 成 为 一 项 异常 艰难 的 工作 。 第 二 部 分 包括 第 2~5 革 : 











第 2 革 ”讲解 了 虚拟 机 中 内 存 是 如 何 划 分 的 ， 以 及 哪 部 分 区 域 、 什 
么 样 的 代码 和 操作 可 能 导致 内 存 洲 出 异常 ， 并 讲解 了 各 个 区 域 出 现 内 存 
洲 出 异常 的 常见 原因 。 





第 3 章 ”分 析 了 垃圾 收集 的 算法 和 JDK 1.7 中 提供 的 几 款 垃圾 收集 器 
的 特点 及 运作 原理 。 通 过 代码 实例 验证 了 Java 虚 拟 机 中 自动 内 存 分 配 及 
回收 的 主要 规则 。 





第 4 章 ”介绍 了 随 JDK 友 布 的 6 个 命令 行 工具 与 两 个 可 视 化 的 故障 处 
理工 具 的 使 用 方法 。 


第 5 章 ”与 读者 分 享 了 几 个 比较 有 代表 性 的 实际 案例 ， 还 准备 了 一 
个 所 有 开发 人 员 都 能 “亲身 实战 ”的 练习 ， 读 者 可 通过 实践 来 获得 故障 处 
理 和 调 优 的 经 验 。 











第 三 部 分 “虚拟 机 执行 子 系统 


执行 子 系统 是 虚拟 机 中 必 不 可 少 的 组 成 部 分 ， 了 解 了 虚拟 机 如 何 执 
行程 序 ， 才 能 写 出 更 优秀 的 代码 。 第 三 部 分 包括 第 6~9 章 : 


第 6 章 ”讲解 了 Class 文 件 结构 中 的 各 个 组 成 部 分 ， 以 及 每 个 部 分 的 
定义 、 数 据 结构 和 使 用 方法 ， 以 实战 的 方式 演示 了 Class 文 件 的 数据 是 如 
何 存储 和 访问 的 。 


第 7 章 ”介绍 了 类 加 载 过 程 的 “加 载 "、“ 验 证 *"、“ 准 备 "”、“ 解 
析 ” 和 “初始 化 ”5 个 阶段 中 虚拟 机 分 别 执行 了 哪些 动作 ， 还 介绍 了 类 加 载 
器 的 工作 原理 及 其 对 虚拟 机 的 意义 。 





第 8 章 分析 了 虚拟 机 在 执行 代码 时 如 何 找 到 正确 的 方法 ， 如 何 执 


行 方法 内 的 字 市 码 ， 以 及 执行 代码 时 涉及 的 内 存 结构 。 


第 9 章 ”通过 4 个 类 加 载 及 执行 子 系统 的 采 例 ,分享 了 使 用 类 加 载 占 
和 处 理 字 节 人 码 的 一 些 值得 欣赏 和 借鉴 的 思路 ， 并 通过 一 个 实战 练习 来 加 
深 对 前 面 理论 知识 的 理解 。 





第 四 部 分 “程序 编译 与 代码 优化 


Java 程 序 从 源码 编译 成 字 节 人 码 和 从 字 节 码 编译 成 本 地 机 器 码 的 这 两 
个 过 程 ， 合 并 起 来 其 实 就 等 同 于 一 个 传统 编译 器 所 执行 的 编译 过 程 。 第 
四 部 分 包括 第 10~11 章 : 

第 10 章 ”分析 了 Java 语 言 中 泛 型 、 主 动 装 箱 和 拆 箱 、 条 件 编译 等 多 


种 语法 糖 的 前 因 后 果 ， 并 通过 实战 演示 了 如 何 使 用 插入 式 注解 处 理 器 来 
实现 一 个 检 枉 程 序 命 名 规范 的 编译 右 插 件 。 


第 11 章 ”讲解 了 虚拟 机 的 热点 探测 方法 、HotSpot 的 即时 编译 器 、 
编译 触发 条 件 ， 以 及 如 何 从 虚拟 机 外 部 观察 和 分 析 JIT 编 译 的 数据 和 结 
果 ， 此 外 ， 还 讲解 了 几 种 常见 的 编译 优化 技术 。 


第 五 部 分 ”高效 并 发 


型 


Java 语 言 和 虚拟 机 提供 了 原生 的 、 完 善 的 多 线程 文 持 ， 这 使 得 它 天 
生 就 适合 开发 多 线程 并 发 的 应 用 程序 。 不 过 我 们 不 能 期 望 系统 来 完成 所 
有 并 发 相关 的 处 理 ， 了 解 并 发 的 内 幕 也 是 成 为 一 个 高 级 程序 员 不 可 缺少 


的 谍 程 。 第 五 部 分 包括 第 12~13 章 : 


第 12 章 ”讲解 了 虚拟 机 Java 内 存 模 型 的 结构 及 操作 ， 以 及 原子 性 、 
可 见 性 和 有 序 性 在 Java 内 存 模 型 中 的 体现 ， 介 绍 了 移行 发 生 原则 的 规则 
及 使 用 ， 还 了 解 了 线程 在 Java 语 言 中 是 如 何 实现 的 。 








第 13 草 ”介绍 了 线程 安全 涉及 的 概念 和 分 类 、 同 步 实现 的 方式 及 虚 
拟 机 的 后 层 运作 原理 ， 并 且 介 绍 了 虚拟 机 实现 局 效 并 发 所 采取 的 一 系列 
锁 优 化 措施 。 


参考 资料 


本 书 名 为 “深入 理解 Java 虚 拟 机 ?”， 但 要 想 深 入 理解 虚拟 机 ， 仅 攒 一 
本 书 肯 定 古 远 远 不 够 的 ， 读 者 可 以 通过 以 下 信息 找到 更 多 关于 Java 虚 拟 
机 方面 的 资料 。 我 在 写作 此 书 的 时 候 ， 也 从 下 面 这 些 参考 资料 中 获得 了 
很 大 的 帮助 。 


(1) 书籍 
《The Java Virtual Machine Specification,Java SE 7 Edition》(| 


要 学 习 虚 拟 机 ， 无 论 如 何 都 必须 掌握 “Java 虚 拟 机 规范 ”"。 这 本 书 的 
概念 和 细节 描述 与 Sun 的 早期 虚拟 机 (Sun Classic VM) 高 度 吻 合 ， 不 
过 ， 随 着 技术 的 发 展 ， 高 性 能 虚拟 机 真正 的 细节 实现 方式 已 经 渐渐 与 虚 
拟 机 规范 所 描述 的 差距 越 来 越 大 ， 如 果 只 能 选择 一 本 参考 书 来 了 解 虚 拟 
机 ， 那 我 推荐 这 本 书 。 此 书 的 Java SE 7 版 在 2011 年 7 月 出 版 发 行 ， 这 是 
自 1999 年 发 布 的 《Java 虚 拟 机 规范 《第 2 版 ) 》 以 来 的 第 一 次 版 本 更 
新 。 笔 者 对 Java SE 7 版 的 全 文 进 行 了 翻译 ， 并 与 原 书 一 样 在 网 上 免费 发 
布 了 全 文 PDFI。 





《The Java Language Specification,Java SE 7 Edition》 3 


里 然 虚 拟 机 并 不 是 Java 语 言 专 有 的 ， 但 是 了 解 Java 语 言 的 各 种 细 市 


规定 对 理解 虚拟 机 的 行为 也 是 很 有 帮助 的 ， 它 与 上 一 本 《Java 虚 拟 机 规 
范 》 都 是 Sun 官 方 出 品 的 书籍 ， 而 且 这 本 书 还 是 由 Java 之 父 James Gosling 
亲自 执笔 撰写 的 。 这 本 书 也 与 《Java 虚 拟 机 规范 》 一 样 ， 可 以 在 官方 网 
站 完全 免费 下 载 到 全 文 PDF， 但 暂时 没有 中 文 译本 ，《Java 语 言 规范 
(第 3 版 )》 于 2005 年 7 月 由 机 械 工业 出 版 社 引 进出 版 。 


《Oracle JRockit The Definitive Guide》 


《Oracle JRockit 权 威 指南 》，2010 年 7 月 出 版 ， 国 内 也 没有 【可 能 
是 尚未 ) 引进 这 本 书 ， 它 是 由 JRockit 的 两 位 资深 开发 人 员 (其 中 一 位 还 
是 JRockit Mission Control 团 队 的 TeamLeader) 撰写 的 JRockit 虚 拟 机 高 级 
使 用 指南 。 虽 然 JRockit 的 用 户 量 可 能 不 如 HotSpot 多 ， 但 也 是 目前 最 流 
行 的 三 大 商业 虚拟 机 之 一 ， 并 且 不 同 虚拟 机 中 的 很 多 实现 思路 都 是 可 以 
对 比 参照 的 。 这 本 书 是 了 解 现代 高 性 能 虚拟 机 很 好 的 参考 资料 。 














《Inside the Java 2 Virtual Machine,Second Edition》 


《深入 Java 虚 拟 机 (第 2 版 ，》，2000 年 1 月 出 版 ，2003 年 由 机 械 工 
业 出 版 社 出 版 其 中 文 译 本 。 在 相当 长 的 时 间 里 ， 这 本 书 是 唯一 的 一 本 关 
于 Java 虚 拟 机 的 中 文 图 书 。 











《Java Performance》 


《Java Performance》 是 "The Java" 系 列 〈 许 多 人 都 读 过 该 系列 中 最 


出 名 的 《Effective Java》 ) 图 书 中 最 新 的 一 本 ，2011 年 10 月 出 版 ， 和 暂时 
没有 中 文 版 。 这 本 书 并 非 全 部 都 围绕 Java 虚 拟 机 (只 有 第 3、4、7 章 直 
接 与 Java 虚 拟 机 相关 ) ， 而 是 从 操作 系统 到 基于 Java 的 上 层 程序 性 能 度 
量 和 调 优 的 全 面 介绍 ， 其 中 涉及 Java 虚 拟 机 的 内 容 具 备 一 定 的 深度 和 可 
实践 性 。 


(2) 网 站 资源 
高 级 语言 虚拟 机 圈子 : http://hllvm.group.iteye.com/ 


里 面 有 一 些 国内 关于 虚拟 机 的 讨论 ， 并 不 只 限于 VM， 而 是 涉及 对 
所 有 的 高 级 语言 虚拟 机 (High-Level Language Virtual Machine) 的 讨 
论 ， 但 该 网 站 建立 在 ITEye 上 ， 自 然 还 是 以 讨论 Java 虚 拟 机 为 主 。 圈 主 
RednaxelaFX〔〈 黄 酌 ) 的 博客 (http:/rednaxelafx.iteye.com/) 是 另外 一 个 
非常 有 价值 的 虚拟 机 及 编译 原理 等 资料 的 分 享 园 地 。 


HotSpot Internals: 


https://wikis.oracle.com/display/HotSpotInternals/Home 


一 个 关于 OpenJDK 的 Wiki 网 站 ， 许 多 文章 都 由 JDK 的 开发 团队 编 
写 ， 更 新 较 慢 ， 但 是 仍然 有 很 高 的 参考 价值 。 





The HotSpot Group: http://openjdk.java.net/groups/hotspot/ 


HotSpot 组 群 ， 包 含 虚拟 机 开 及 、 编 译 器 、 垃 圾 收集 和 运行 时 4 个 邮 


件 组 ， 其 中 有 关于 HotSpot 虚 拟 机 的 最 新 讨论 。 


四 官方 地 址 : http://docs.oracle.com/javase/specs/jvms/se7/jvms7.pdf。 
加 官方 地 址 : http://docs.oracle.com/javase/specs/jls/se7/jls7.pdf。 


3] 中文 译本 地 址 : http://icyfenix.iteye.com/blog/1256329。 


项 误 和 文 持 


在 本 书 交 稿 的 时 候 ， 我 并 不 像 想象 中 的 那样 兴奋 或 放松 ， 写 作 之 时 
那 种 “ 战 战 殉 区 、 如 履 薄 冰 ” 的 感觉 依然 蒙 绕 在 心头 。 在 每 一 章 、 每 一 节 
落笔 之 时 ， 我 都 在 考虑 如 何 才 能 把 各 个 知识 点 更 有 条 理 地 讲述 出 来 ， 同 
时 也 在 担心 会 不 会 由 于 自己 理解 有 偏差 而 误导 了 读者 。 由 于 写作 水 平和 
写作 时 间 所 限 ， 书 中 难免 存在 不 妥 之 处 ， 所 以 特地 开通 了 一 个 读者 邮箱 
(understandingjvm@gmail.com) 与 大 家 交流 ， 大 家 如 有 任何 意见 或 建 
议 欢迎 与 我 联系 。 相 信 写 书 与 写 程序 一 样 ， 作 品 一 定 都 是 不 完美 的 ， 因 
为 不 完美 ， 我 们 才 有 不 断 追 求 完美 的 动力 。 























本 书 第 2 版 的 勘误 ， 将 会 在 作者 的 博客 (http://icyfenix.iteye.cony) 
中 发 布 。 欢 迎 读 者 在 博客 上 留言 。 
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第 1 章 ” 走 近 Java 


第 1 章 ” 走 近 Java 
世界 上 并 没有 完美 的 程序 ， 但 我 们 并 不 因此 而 诅 才 ， 因 为 写 程序 本 
来 就 是 一 个 不 断 追 求 完美 的 过 程 。 


1.1 概述 


Java 不 仅仅 是 一 门 编程 语言 ， 还 是 一 个 由 一 系列 计算 机 软件 和 规范 
形成 的 技术 体系 ， 这 个 技术 体系 提供 了 完整 的 用 于 软件 开 及 和 路 平台 部 
车 的 文 持 环境 ， 并 广泛 应 用 于 舱 入 式 系统 、 移 动 终端 、 企 业 服 务 器 、 大 
型 机 等 各 种 场合 ， 如 图 1-1 所 示 。 时 至 今日 ，Java 技 术 体系 已 经 吸引 了 
900 多 万 软件 开发 者 ， 这 是 全 球 最 大 的 软件 开发 团队 。 使 用 Java 的 设备 
多 达 几 十 亿 人 台 ， 其 中 包括 11 亿 多 人 台 个 人 计算 机 、30 亿 部 移动 电话 及 其 他 
手持 设备 、 数 量 众多 的 智能 卡 ， 以 及 大 量 机 顶 盒 、 导 航 系统 和 其 他 设 
备品 。 


Developers 
Devices 
GlassFish 
Desktops 
phones 
Televisions 





图 1-1 Java 技 术 的 广泛 应 用 


Java 能 获得 如 此 广泛 的 认可 ， 除 了 它 拥 有 一 门 结构 严 谨 、 面 癌 对 象 
的 编程 语言 之 外 ， 还 有 许多 不 可 忽视 的 优点 : 它 摆脱 了 硬件 平 合 的 束 
缚 ， 实 现 了 一 次 编写 ， 到 处 运行 ”的 理想 ; 它 提 供 了 一 个 相对 安全 的 内 
存 管 理 和 访问 机 制 ， 避 免 了 绝 大 部 分 的 内 存 泄露 和 指针 越界 问题 ， 它 实 
现 了 热点 代码 检测 和 运行 时 编译 及 优化 ， 这 使 得 Java 应 用 能 随 着 运行 时 
间 的 增加 而 获得 更 高 的 性 能 ， 它 有 一 僚 完 善 的 应 用 程序 接口 ， 还 有 无 数 
来 自 商 业 机 构 和 开源 社区 的 第 三 方 类 库 来 帮助 它 实现 各 种 各 样 的 功 
能 .…….Java 所 带 来 的 这 些 好 处 使 程序 的 开发 效率 得 到 了 很 大 的 提升 。 作 
为 一 名 Java 程 序 员 ， 在 编写 程序 时 除了 尽情 发 挥 Java 的 各 种 优势 外 ， 还 











该 去 了 解 和 思考 一 下 Java 技 术 体 系 中 这 些 技术 特性 是 如 何 实现 的 。 认 
识 这 些 技术 运作 的 本 质 ， 是 上 自己 思考 “程序 这 样 写 好 不 好 ?的 基础 和 前 
担 。 当 我 们 在 使 用 一 种 技术 时 ， 如 采 不 再 依赖 书本 和 他 人 就 能 得 到 这 些 
问题 的 答案 ， 那 才 算 上 升 到 了 "不惑 ” 的 境界 。 





本 书 将 与 读者 一 起 分 析 Java 技 术 中 最 重要 的 那些 特性 的 实现 原理 。 
在 本 章 中 ， 我 们 将 重点 介绍 Java 技 术 体系 内 容 以 及 Java 的 历史 、 现 在 和 
未 来 的 发 展 趋势 。 





[1 这 些 数据 是 Java 的 广告 词 ， 它 们 来 源 于 : 
http:/ /www.java.com/zh_CN/about/。 


1.2 Java 技术 体 系 


从 广义 上 讲 ，Clojure、JRuby、Groovy 等 运行 于 Java 虚 拟 机 上 的 语 
言及 其 相关 的 程序 都 属于 Java 技 术 体 系 中 的 一 员 。 如 果 仅 从 传统 意义 上 
来 看 ，Sun 官 方 所 定义 的 Java 技 术 体系 包括 以 下 几 个 组 成 部 分 : 

Java 程 序 设 计 语 言 

各 种 人 硬件 平台 上 的 Java 虚 拟 机 

Class 文 件 格 式 
Java API 类 库 
来 自 商 业 机 构 和 开源 社区 的 第 三 方 Java 类 库 


我 们 可 以 把 Java 程 序 设计 语言 、Java 虚 拟 机 、Java API 类 库 这 三 部 分 
统称 为 JDK (Java Development Kit) ，JDK 是 用 于 支持 Java 程 序 开发 的 
最 小 环境 ， 在 后 面 的 内 容 中 ， 为 了 讲解 方便 ， 有 一 些 地 方 会 以 JDK 来 代 
蔡 整 个 Java 技 术 体 系 。 另 外 ， 可 以 把 Java API 类 库 中 的 Java SE API 子 集 
帆 和 Java 虚 拟 机 这 两 部 分 统称 为 JRE (Java Runtime Environment) ，JRE 
是 支持 Java 程 序 运 行 的 标准 环境 。 图 1-2 展 示 了 Java 技 术 体 系 所 包含 的 内 








容 ， 以 及 JDK 和 JRE 所 涵盖 的 范围 。 
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图 1-2 Java 技 术 体 系 所 包含 的 内 容 站 


以 上 是 根据 各 个 组 成 部 分 的 功能 来 进行 划分 的 ， 如 果 按 照 技 术 所 服 
务 的 领域 来 划分 ， 或 者 说 按照 Java 技 术 关 注 的 重点 业务 领域 来 划分 ， 
Java 技 术 体系 可 以 分 为 4 个 平台 ， 分 别 为 : 


Java Card: 支持 一 些 Java 小 程序 (Applets) 运行 在 小 内 存 设 备 〈 如 
智能 卡 ) 上 的 平台 。 


Java ME (Micro Edition ) : 支持 Java 程 序 运行 在 移动 终端 (手机 、 
PDA) 上 的 平台 ， 对 Java API 有 所 精简 ， 并 加 入 了 针对 移动 终端 的 文 
持 ， 这 个 版 本 以 前 称 为 J2ME。 


Java SE (Standard Edition) : 支持 面 癌 桌 面 级 应 用 (如 Windows 下 
的 应 用 程序 ) 的 Java 平 台 ， 提 供 了 完整 的 Java 核 心 API， 这 个 版 本 以 前 称 


为 JSE。 


Java EE (Enterprise Edition) : 文 持 使 用 多 层 架 构 的 企业 应 用 (如 
ERP、CRM 应 用 ) 的 Java 平 台 ， 除 了 提供 Java SE API 外 ， 还 对 其 做 了 大 
量 的 扩充 5 并 提供 了 相关 的 部 署 支持 ， 这 个 版 本 以 前 称 为 J2EE。 


IJDK 1.7 的 Java SE API 范 围 : 
http:/ /download.oracle.com/javase/7/docs/api/。 

图 片 来源 : http://download.oracle.com/javase/7/docs/。 

[3] 这 些 扩 展 一 般 以 javax.* 作 为 包 名 ， 而 以 java.* 为 包 名 的 包 都 是 Java SE 
API 的 核心 包 ， 但 由 于 历史 原因 ， 一 部 分 曾经 是 扩展 包 的 API 后 来 进入 了 


是 
核心 包 ， 因 此 核心 包 中 也 包含 了 不 少 javax.* 的 包 名 。 


1.3 Java 发 展 史 


从 第 一 个 Java 版 本 诞生 到 现在 已 经 有 18 年 的 时 间 了 。 沧 海 桑田 一 瞬 
间 ， 转 眼 18 年 过 去 了， 在 图 1-3 所 展示 的 时 间 线 中 ， 我 们 看 到 JDK 已 经 发 
展 到 了 1.7 版 。 在 这 18 年 里 还 诞生 了 无 数 和 Java 相 关 的 产品 、 技 术 和 标 
准 。 现 在 让 我 们 走 入 时 间 隧 道 ， 从 孕育 Java 语 言 的 时 代 开 始 ， 再 来 回顾 
一 下 Java 的 发 展 轨迹 和 历史 变迁 
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图 1-3 Java 技 术 发 展 的 时 间 线 


1991 年 4 月 ， 由 James Gosling 博 士 领导 的 绿色 计划 (Green Project) 
开始 启动 ， 此 计划 的 目的 是 开发 一 种 能 够 在 各 种 消费 性 电子 产品 (如 机 
顶 盒 、 冰 箱 、 收 音 机 等 ) 上 运行 的 程序 架构 。 这 个 计划 的 产品 就 是 Java 
语言 的 前 身 : Oak (橡树 ) 。Oak 当 时 在 消费 品 市 场 上 并 不 算 成 功 ， 但 
随 着 1995 年 互联 网 潮流 的 兴起 ，Oak 迅 速 找 到 了 最 适合 自己 发 展 的 市 场 











定位 并 赔 变 成 为 Java 语 言 。 


1995 年 5 月 23 日 ，Oak 语 言 改 名 为 Java， 并 且 在 SunWorld 大 会 上 正式 
发 布 Java 1.0 版 本 。Java 语 言 第 一 次 提出 了 "Write Once,Run Anywhere" 的 


号 


口气 。 


1996 年 1 月 23 日 ，JDK 1.0 发 布 ，Java 语 言 有 了 第 一 个 正式 版 本 的 运 
行 环 境 。JDK 1.0 提 供 了 一 个 纯 解 释 执行 的 Java 虚 拟 机 实现 〈Sun Classic 
VM) 。JDK 1.0 版 本 的 代表 技术 包括 : Java 虚 拟 机 、Applet、AWT 等 。 


1996 年 4 月 ，10 个 最 主要 的 操作 系统 供应 商 申明 将 在 其 产品 中 其 入 
Java 技 术 。 同 年 9 月 ， 已 有 大 约 8.3 万 个 网 页 应 用 了 Java 技 术 来 制作 。 在 
1996 年 5 月 底 ，Sun 公 司 于 美国 旧金山 举行 了 首届 JavaOne 大 会 ， 从 此 
JavaOne 成 为 全 世界 数 百 万 Java 语 言 开 发 者 每 年 一 度 的 技术 盛会 。 








1997 年 2 月 19 日 ，Sun 公 司 发 布 了 JDK 1.1，Java 技 术 的 一 些 最 基础 的 
支撑 点 (如 JDBC 等 ) 都 是 在 JDK 1.1 版 本 中 发 布 的 ，JDK 1.1 版 的 技术 代 
表 有 : JAR 文 件 格式 、JDBC、JavaBeans、RMI。Java 语 法 也 有 了 一 定 的 





发 展 ， 如 内 部 类 (Inner Class) 和 反射 (Reflection ) 都 是 在 这 个 时 候 出 


现 的 。 


直到 1999 年 4 月 8 日 ，JDK 1.1 一 共 发 布 了 1.1.0~1.1.8 九 个 版 本 。 从 
1.1.4 之 后 ， 每 个 JDK 版 本 都 有 一 个 自己 的 名 字 【〈 工 程 代号 ) ， 分 别 为 : 
JDK 1.1.4-Sparkler〈 宝 石 ) 、JDK 1.1.5-Pumpkin 〈 南 瓜 ) 、JDK 1.1.6- 





Abigail ( 阿 比 盖 尔 ， 女 子 名 ) 、JDK 1.1.7-Brutus 〈 布 鲁 图 ， 古 罗马 政治 
家 和 将 军 ) 和 JDK 1.1.8-Chelsea (切尔西 ， 城 市 名 ) 。 


1998 年 12 月 4 日 ，JDK 迎 来 了 一 个 里 程 碑 式 的 版 本 JDK 1.2， 工 程 代 
号 为 Playground (竞技 场 ) ，Sun 在 这 个 版 本 中 把 Java 技 术 体系 拆 分 为 3 
个 方向 ， 分 别 是 面 问 蝎 面 应 用 开发 的 J2SE (Java 2 Platform,Standard 
Edition) 、 面 向 企业 级 开发 的 J2EE (Java 2 Platform,Enterprise Edition ) 
和 面向 手机 等 移动 终端 开发 的 J2ME (Java 2 Platform,Micro Edition ) 。 
在 这 个 版 本 中 出 现 的 代表 性 技术 非常 多 ， 如 EJB、Java Plug-in、Java 
IDL、Swing 等 ， 并 且 这 个 版 本 中 Java 虚 拟 机 第 一 次 内 置 了 JIT (Just In 
Time) 编译 器 (JDK 1.2 中 曾 并 存 过 3 个 虚拟 机 ，Classic VM、HotSpot 
VM 和 Exact VM， 其 中 Exact VM 只 在 Solaris 平 台 出 现 过 ;后面 两 个 虚拟 
机 都 是 内 置 JIT 编 译 器 的 ， 而 之 前 版 本 所 融 的 Classic VM 只 能 以 外 挂 的 形 
式 使 用 JIT 编 译 器 ) 。 在 语言 和 API 级 别 上 ，Java 添 加 了 strictfp 关 键 字 与 
现在 Java 编 码 之 中 极为 常用 的 一 系列 Collections 集 合 类 。 在 1999 年 3 月 和 
7 月 ， 分 别 有 JDK 1.2.1 和 JDK 1.2.2 两 个 小 版 本 发 布 。 


1999 年 4 月 27 日 ，HotSpot 虚 拟 机 发 布 ，HotSpot 最 初 由 一 家 名 
为 "Longview Technologies" 的 小 公司 开发 ， 因 为 HotSpot 的 优异 表现 ， 这 
家 公司 在 1997 年 被 Sun 公 司 收购 了 。HotSpot 虚 拟 机 发 布 时 是 作为 JDK 
1.2 的 附加 程序 提供 的 ， 后 来 它 成 为 了 JDK 1.3 及 之 后 所 有 版 本 的 Sun 
JDK 的 默认 虚拟 机 。 


2000 年 5 月 8 日 ， 工 程 代号 为 Kestrel (美洲 红 集 ) 的 JDK 1.3 发 布 ， 
JDK 1.3 相 对 于 JDK 1.2 的 改进 主要 表现 在 一 些 类 库 上 如 数学 运算 和 新 
的 Timer API 等 ) ，JNDI 服 务 从 JDK 1.3 开 始 被 作为 一 项 平台 级 服务 提供 
(以 前 JINDI 仅 仅 是 一 项 扩展 ) ， 使 用 CORBA IOP 来 实现 RMI 的 通信 协 
议 ， 等 等 。 这 个 版 本 还 对 Java 2D 做 了 很 多 改进 ， 提 供 了 大 量 新 的 Java 
2D API， 并 且 新 添加 了 JavaSound 类 库 。JDK 1.3 有 1 个 修正 版 本 JDK 
1.3.1， 工 程 代号 为 Ladybird〈 球 虫 ) ， 于 2001 年 5 月 17 日 发 布 。 


自从 JDK 1.3 开 始 ，Sun 维 持 了 一 个 习惯 : 大 约 每 隔 两 年 发 布 一 个 
JDK 的 主 版 本 ， 以 动物 命名 ， 期 间 发 布 的 各 个 修正 版 本 则 以 昆虫 作为 工 
程 名 称 。 


2002 年 2 月 13 日 ，JDK 1.4 发 布 ， 工 程 代号 为 Merlin〈( 灰 背 华 )。 
JDK 1.4 是 Java 真 正 走 同 成 熟 的 一 个 版 本 ，Compaq、Fujitsu、SAS、 
Symbian、IBM 等 著名 公司 都 有 参与 甚至 实现 自己 独立 的 JDK 1.4。 哪 怕 
是 在 十 多 年 后 的 今天 ， 仍 然 有 许多 主流 应 用 (Spring、Hibernate、Struts 
等 ) 能 直接 运行 在 JDK 1.4 之 上 ， 或 者 继续 发 布 能 运行 在 JDK 1.4 上 的 版 
本 。JDK 1.4 同 样 发 布 了 很 多 新 的 技术 特性 ， 如 正则 表达 式 、 异 常 链 、 
NIO、 日 志 类 、XML 解 析 器 和 XSLT 转 换 器 等 。JDK 1.4 有 两 个 后 续 修正 
版 : 2002 年 9 月 16 日 发 布 的 工程 代号 为 Grasshopper〈 昨 蝠 ) 的 JDK 1.4.1 
与 2003 年 6 月 26 日 及 布 的 工程 代号 为 Mantis〈 星 螂 ) 的 JDK 1.4.2。 








2002 年 前 后 还 发 生 了 一 件 与 Java 没 有 直接 关系 ， 但 事实 上 对 Java 的 





发 展 进 程 影 响 很 大 的 事件 ， 那 束 是 微软 公司 的 .NET Framework 发 布 了 。 

这 个 无 论 是 技术 实现 上 还 是 目标 用 户 上 都 与 Java 有 很 多 相近 之 处 的 技术 
平台 给 Java 融 来 了 很 多 讨论 、 比 较 和 竞争 ，.NET 平 台 和 Java 平 台 之 间 声 
势 洗 大 的 讨 优 讨 劣 的 论 碾 到 目前 为 止 都 在 继续 。 





2004 年 9 月 30 日 ，JDK 1.5 由 发 布 ， 工 程 代号 Tiger (老虎 ) 。 从 JDK 
1.2 以 来 ，Java 在 语法 层面 上 的 变换 一 直 很 小 ， 而 JDK 1.5 在 Java 语 法 易 用 
性 上 做 出 了 非常 大 的 改进 。 例 如 ， 自 动 装 箱 、 泛 型 、 动 态 注解 、 枚 举 、 
可 变 长 参数 、 遍 历 循 环 (foreach 循 环 〉 等 语法 特性 都 是 在 JDK 1.5 中 加 
入 的 。 在 虚拟 机 和 API 层 面 上 ， 这 个 版 本 改进 了 Java 的 内 存 模型 (Java 
Memory ModelJMM) 、 提 供 了 java.util.concurrent 并 发 包 等 。 男 外 ， 


JDK 1.5 是 官方 声明 可 以 支持 Windows 9x 平 台 的 最 后 一 个 JDK 版 本 。 





2006 年 12 月 11 日 ，JDK 1.6 发 布 ， 工 程 代 号 Mustang (野马 ) 。 在 这 
个 版 本 中 ，Sun 终 结 了 从 JDK 1.2 开 始 已 经 有 8 年 历史 的 J2EE、J2SE、 
J2ME 的 命名 方式 ， 启 用 Java SE 6、Java EE 6、Java ME 6 的 命名 方式 。 
JDK 1.6 的 改进 包括 : 提供 动态 语言 文 持 〈 通 过 内 置 Mozilla JavaScript 
Rhino 引 擎 实现 ) 、 提 供 编译 API 和 微型 HTTP 服务器 API 等 。 同 时， 这 个 
版 本 对 Java 虚 拟 机 内 部 做 了 大 量 改进 ， 包 括 锁 与 同步 、 垃 圾 收集 、 类 加 
载 等 方面 的 算法 都 有 相当 多 的 改动 。 


在 2006 年 11 月 13 日 的 JavaOne 大 会 上 ，Sun 公 司 宣布 最 终 会 将 Java 开 
源 ， 并 在 随后 的 一 年 多 时 间 内 ， 陆 续 将 JDK 的 各 个 部 分 在 GPL v2 (GNU 


General Public License v2) 协议 下 公开 了 源码 ， 并 建立 了 OpenJDK 组 织 
对 这 些 源码 进行 独立 管理 。 除 了 极 少量 的 产权 代码 (Encumbered 
Code， 这 部 分 代码 大 多 是 Sun 本 身 也 无 权限 进行 开源 处 理 的 ) 外 ， 
OpenJDK 几 乎 包括 了 Sun JDK 的 全 部 代码 ，OpenJDK 的 质量 主管 曾经 表 
示 ， 在 JDK 1.7 中 ，Sun JDK 和 OpenJDK 除 了 代码 文件 头 的 版 权 注释 之 
外 ， 代 码 基 本 上 完全 一 样 ， 所 以 OpenJDK 7 与 Sun JDK 1.7 本 质 上 就 是 同 
一 套 代码 库 开 发 的 产品 。 





JDK 1.6 发 布 以 后 ， 由 于 代码 复杂 性 的 增加 、JDK 开 源 、 开 发 
JavaFX、 经 济 危 机 及 Sun 收 购 案 等 原因 ，Sun 在 JDK 发 展 以 外 的 事情 上 耗 
费 了 很 多 资源 ，JDK 的 更 新 没有 再 维持 两 年 发 布 一 个 主 版 本 的 发 展 速 
度 。JDK 1.6 到 目前 为 止 一 共 发 布 了 37 个 Update 版 本 ， 最 新 的 版 本 为 Java 
SE 6 Update 37， 于 2012 年 10 月 16 日 发 布 。 





2009 年 2 月 19 日 ， 工 程 代号 为 Dolphin (海豚 〉 的 JDK 1.7 完 成 了 其 第 
一 个 里 程 碑 版 本 。 根 据 JDK 1.7 的 功能 规划 ， 一 共 设 置 了 10 个 里 程 碑 。 
最 后 一 个 里 程 碑 版 本 原 计划 于 2010 年 9 月 9 日 结束 ， 但 由 于 各 种 原因 ， 
JDK 1.7 最 终 无 法 按 计 划 完 成 。 


从 JDK 1.7 最 开始 的 功能 规划 来 看 ， 它 本 应 是 一 个 包含 许多 重要 改 
进 的 JDK 版 本 ， 其 中 的 Lambda 项 目 〈Lambda 表 达 式 、 函 数 式 编程 ) 、 
Jigsaw 项 目 ( 虚 拟 机 模块 化 支持 ) 、 动 态 语言 支持 、GarbageFirst 收 集 器 
和 Coin 项 目 《〈 语 言 细 节 进 化 ) 等 子 项 目 对 于 Java 业 界 都 会 产生 深远 的 影 





啊 。 在 JDK 1.7 开 发 期 间 ，Sun 公 司 由 于 相继 在 技术 竞争 和 商业 竞争 中 都 
陷入 泥潭 ， 公 司 的 股票 市 值 跌 至 仅 有 高 峰 时 期 的 3%， 已 无 力 推动 JDK 
1.7 的 研发 工作 按 正 常 计划 进行 。 为 了 尽快 结束 JDK 1.7 长 期 “ 跳 票 ”的 问 
题 ，Oracle 公 司 收购 Sun 公 司 后 不 久 便 宣布 将 实行 " 吧 计 划 ”， 大 幅 裁 剪 
JDK 1.7 预 定 目标 ， 以 便 保证 JDK 1.7 的 正式 版 能 够 于 2011 年 7 月 28 日 准时 
发 布 。“B 计 划 ” 把 不 能 按时 完成 的 Lambda 项 目 、Jigsaw 项 目 和 Coin 项 目 
的 部 分 改进 延迟 到 JDK 1.8 之 中 。 最 终 ，JDK 1.7 的 主要 改进 包括 : 提供 
新 的 G1 收 集 器 〈G1 在 发 布 时 依然 处 于 Experimental 状 态 ， 直 至 2012 年 4 
月 的 Update 4 中 才 正 式 “ 转 正 ”) 、 加 强 对 非 Java 语 言 的 调用 支持 (JSR- 
292， 这 项 特性 到 目前 为 止 依然 没有 完全 实现 定型 ) 、 升 级 类 加 载 架 构 


及 
等 。 








到 目前 为 止 ，JDK 1.7 已 经 发 布 了 9 个 Update 版 本 ， 最 新 的 Java SE 7 
Update 9 于 2012 年 10 月 16 日 发 布 。 从 Java SE 7 Update 4 起 ，Oracle 开 始 文 
持 Mac OS X 操 作 系 统 ， 并 在 Update 6 中 达到 完全 支持 的 程度 ， 同 时 ， 在 
Update 6 中 还 对 ARM 指 令 集 架 构 提 供 了 文 持 。 至 此 ， 官 方 提供 的 JDK 可 
以 运行 于 Windows 〈 不 含 Windows 9x) 、Linux、Solaris 和 Mac OS 平台 


上 ， 支 持 ARM、x86、x64 和 Sparc 指 令 集 架构 类 型 。 





2009 年 4 月 20 日 ，Oracle 公 司 宣布 正式 以 74 亿 美元 的 价格 收购 Sun 公 
司 ，Java 商 标 从 此 正式 归 Oracle 所 有 (Java 语言 本 上身 并 不 属于 哪 间 公司 
所 有 ， 它 由 JCP 组 织 进行 管理 ， 尽 管 JCP 主 要 是 由 Sun 公 司 或 者 说 Oracle 





公司 所 领导 的 ) 。 由 于 此 前 Oracle 公 司 已 经 收购 了 另外 一 家 大 型 的 中 间 
件 企业 BEA 公 司 ， 在 完成 对 Sun 公 司 的 收购 之 后 ，Oracle 公 司 分 别 从 
BEA 和 Sun 中 取得 了 目前 三 大 商业 虚拟 机 的 其 中 两 个 : JRockit 和 
HotSpobOracle 公 司 宣布 在 未 来 1~2 年 的 时 间 内 ， 将 把 这 两 个 优秀 的 虚拟 
机 互相 取长补短 ， 最 终 合 二 为 一 中 1。 可 以 预见 在 不 久 的 将 来 ，Java 虚 拟 
机 技术 将 会 产生 相当 巨大 的 变化 。 





根据 Oracle 官 方 提供 的 信息 ，JDK 1.8 的 第 一 个 正式 版 本 将 于 2013 年 
9 月 发 布 ，JDK 1.8 将 会 提供 在 JDK 1.7 中 规划 过 ， 但 最 终 未 能 在 JDK 1.7 
中 发 布 的 特性 ， 即 Lambda 表 达 式 、Jigsaw 〈 很 不 幸 ， 随 后 Oracle 公 司 又 
宣布 Jigsaw 在 JDK 1.8 中 依然 无 法 完成 ， 需 要 延至 JDK 1.9) 和 JDK 1.7 中 
未 实现 的 一 部 分 Coin 等 。 





在 2011 年 的 JavaOne 大 会 上 ，Oracle 公 司 还 提 到 了 JDK 1.9 的 长 远 规 
划 ， 和 希望 未 来 的 Java 虚 拟 机 能 够 管理 数 以 GB 计 的 Java 扒 ， 能 够 更 高 效 地 
与 本 地 代码 和 集成， 并且 令 Java 虚 拟 机 运行 时 尽 可 能 少 人 工 干 预 ， 能 够 自 


动 调 市 。 


[1JDK 从 1.5 版 本 开始 ， 官 方 在 正式 文档 与 宣传 上 已 经 不 再 使 用 类 似 JDK 
1.5 的 命名 ， 只 有 在 程序 员 内 部 使 用 的 开发 版 本 号 (Developer Version， 
例如 java-vetsion 的 输出 ) 中 才 继 续 活用 1.5、1.6、1.7 的 版 本 号 ， 而 公开 版 
本 号 (Product Vetsion) 则 改 为 JDK 5、JDK 6、JDK 7 的 命名 方式 ， 本 书 
为 了 行文 一 致 ， 所 有 场合 统一 采用 开发 版 本 号 的 命名 方式 。 


[2J"HotRockit" 项 目的 相关 介绍 : 


http://hitt.se/presentations/ WhatToExpect.ppto 


1.4 Java 虚拟 机 发 展 史 


上 一 节 我 们 从 整个 Java 技 术 的 角度 观察 了 Java 技 术 的 发 展 ， 许 多 
Java 程 序 员 都 会 潜意识 地 把 它 与 Sun 公 司 的 HotSpot 虚 拟 机 等 同 看 待 ， 也 
许 还 有 一 些 程 序 员 会 注意 到 BEA JRockit 和 IBM J9， 但 对 JVM 的 认识 不 
仅仅 只 有 这 些 。 


从 1996 年 初 Sun 公 司 发 布 的 JDK 1.0 中 所 包含 的 Sun Classic VM 到 今 
天 ， 曾 经 涌现 、 潭 灭 过 许多 或 经 典 或 优秀 或 有 特色 的 虚拟 机 实现 ， 在 这 
一 节 中 ， 我 们 先 暂 且 把 代码 与 技术 放下 ， 一 起 来 回顾 一 下 Java 虚 拟 机 家 
族 的 发 展 轨迹 和 历史 变迁 。 





1.4.1 Sun Classic/Exact YM 


以 今天 的 视角 来 看 ，Sun Classic VM 的 技术 可 能 很 原始 ， 这 款 虚 拟 
机 的 使 命 也 早已 终结 。 但 仅 攒 它 * 世 界 上 第 一 蒜 商 用 Java 虚 拟 机 ”的 头 
衔 ， 就 足够 有 让 历史 记 住 它 的 理由 。 


1996 年 1 月 23 日 ，Sun 公 司 发 布 JDK 1.0，Java 语 言 首次 拥有 了 商用 的 
正式 运行 环境 ， 这 个 JDK 中 所 带 的 虚拟 机 就 是 Classic VM。 这 款 虚 拟 机 
只 能 使 用 纯 解 释 器 方式 来 执行 Java 代 码 ， 如 果 要 使 用 JIT 编 译 器 ， 就 必须 
进行 外 挂 。 但 是 假如 外 挂 了 JIT 编 译 器 ，JIT 编 译 器 就 完全 接管 了 虚拟 机 


的 执行 系统 ， 解 释 器 便 不 再 工作 了 。 用 户 在 这 款 虚 拟 机 上 执行 java- 
version 命 令 ， 将 会 看 到 类 似 下 面 这 行 输出 : 





java VerSion"1.2.2" 
Classic VM (build JDK-1.2.2-001, green threads,sunwjit) 


其 中 的 "sunwjit" 就 是 Sun 提 供 的 外 挂 编 译 器 ， 其 他 类 似 的 外 挂 编译 
器 还 有 Symantec JIT 和 shuJIT 等 。 由 于 解释 器 和 编译 器 不 能 配合 工作 ， 
这 就 意味 着 如 果 要 使 用 编译 器 执行 ， 编 译 占 就 不 得 不 对 每 一 个 方法 、 每 
一 行 代码 都 进行 编译 ， 而 无 论 它们 执行 的 频率 是 否 具 有 编译 的 价值 。 基 
于 程序 啊 应 时 间 的 压力 ， 这 些 编译 器 根本 不 敢 应 用 编译 耗 时 稍 高 的 优化 
技术 ， 因 此 这 个 阶段 的 虚拟 机 即使 用 了 JIT 编 译 器 输出 本 地 代码 ， 执 行 
效率 也 和 传统 的 C/C++ 程序 有 很 大 差距 ，“Java 语 言 很 慢 ” 的 形象 就 是 在 
这 时 候 开 始 在 用 户 心 中 树立 起 来 的 。 
































Sun 的 虚拟 机 团队 努力 去 解决 Classic VM 所 面临 的 各 种 问题 ， 提 升 
运行 效率 。 在 JDK 1.2 时 ， 曾 在 Solaris 平 台 上 发 布 过 一 款 名 为 Exact VM 
的 虚拟 机 ， 它 的 执行 系统 已 经 具备 现代 高 性 能 虚拟 机 的 雏形 : 如 两 级 即 
时 编译 器 、 编 译 器 与 解释 器 混合 工作 模式 等 。Exact VM 因 它 使 用 准确 式 
内 存 管理 〈Exact Memory Management， 也 可 以 叫 Non- 











Conservative/Accurate Memory Management) 而 得 名 ， 即 虚拟 机 可 以 知 
道内 存 中 某 个 位 置 的 数据 具体 是 什么 类 型 。 璧 如 内 存 中 有 一 个 32 位 的 整 
数 123456， 它 到 底 是 一 个 reference 类 型 指向 123456 的 内 存 地 址 还 是 一 个 








数值 为 123456 的 整数 ， 虚 拟 机 将 有 能 力 分 辨 出 来 ， 这 样 才 能 在 GC〈 垃 
圾 收集 ) 的 时 候 准确 判断 堆 上 的 数据 是 能 被 使 用 。 由 于 使 用 了 准 
确 式 内 存 管理 ，Exact VM 可 以 抛弃 以 前 Classic VM 基于 handler 的 对 象 查 
找 方式 〈 原 因 是 进行 GC 后 对 象 将 可 能 会 被 移动 位 置 ， 如 果 将 地 址 为 
123456 的 对 象 移动 到 654321， 在 没有 明确 信息 表明 内 存 中 哪些 数据 是 
reference 的 前 提 下 ， 虚 拟 机 是 不 敢 把 内 存 中 所 有 为 123456 的 值 改 成 
654321 的 ， 所 以 要 使 用 句柄 来 保持 reference 值 的 稳定 ) ， 这 样 每 次 定位 
对 象 都 少 了 一 次 间接 查找 的 开销 ， 提 升 执 行 性 能 











虽然 Exact VM 的 技术 相对 Classic VM 来 说 先进 了 许多 ， 但 是 在 商业 
应 用 上 只 存在 了 很 短暂 的 时 间 就 被 更 为 优秀 的 HotSpot VM 所 取代 ， 甚 至 
还 没有 来 得 及 发 布 Windows 和 Linux 平 台 下 的 商用 版 本 。 而 Classic VM 的 
生命 周期 则 相对 长 了 许多 ， 它 在 JDK 1.2 之 前 是 Sun JDK 中 唯一 的 虚拟 
机 ， 在 JDK 1.2 时 ， 它 与 HotSpot VM 并 存 ， 但 默认 使 用 的 是 Classic 
VM 用户 可 用 java-hotspot 参 数 切换 至 HotSpot VM) ， 而 在 JDK 1.3 时 ， 
HotSpot VM 成 为 默认 虚拟 机 ， 但 Classic VM 仍 作为 虚拟 机 的 “备用 选 
择 ” 发 布 〈 使 用 java-classic 参 数 切 换 ) ， 直 到 JDK 1.4 的 时 候 ，Classic VM 
才 完 全 退出 商用 虚拟 机 的 历史 舞台 ， 与 Exact VM 一 起 进入 了 Sun Labs 
Research VM 之 中 。 


1.4.2 Sun HotSpot VM 


提起 HotSpot VM， 相 信 所 有 Java 程 序 员 都 知道 ， 它 是 Sun JDK 和 
OpenJDK 中 所 带 的 虚拟 机 ， 也 是 目前 使 用 范围 最 广 的 Java 虚 拟 机 。 但 不 
一 定 所 有 人 都 知道 的 是 ， 这 个 目前 看 起 来 “血统 纯正 ”的 虚拟 机 在 最 初 并 
非 由 Sun 公 司 开 发 ， 而 是 由 一 家 名 为 "Longview Technologies" 的 小 公司 设 
计 的 ， 甚 至 这 个 虚拟 机 最 初 并 非 是 为 Java 语 言 而 开发 的 ， 它 来 源 于 
Strongtalk VM， 而 这 款 虚 拟 机 中 相当 多 的 技术 又 是 来 源 于 一 款 文 持 Self 
语言 实现 “达到 C 语 言 50% 以 上 的 执行 效率 ”的 目标 而 设计 的 虚拟 机 ，Sun 
公司 注意 到 了 这 款 虚 拟 机 在 JIT 编 译 上 有 许多 优秀 的 理念 和 实际 效果 ， 
在 1997 年 收购 了 Longview Technologies 公 司 ， 从 而 获得 了 HotSpot VM。 








HotSpot VM 既 继 承 了 Sun 之 前 两 款 商 用 虚拟 机 的 优点 (如 前 面 提 到 
的 准确 式 内 存 管理 ) ， 也 有 许多 自己 新 的 技术 优势 ， 如 它 名 称 中 的 
HotSpot 指 的 就 是 它 的 热点 代码 探测 技术 (其 实 两 个 VM 基本 上 是 同时 期 
的 独立 产品 ，HotSpot 还 稍 早 一 些 ，HotSpot 一 开始 就 是 准确 式 GC， 而 
Exact VM 之 中 也 有 与 HotSpot 几 平一 样 的 热点 探测 。 为 了 Exact VM 和 
HotSpot VM 哪个 成 为 Sun 主 要 支持 的 VM 产品 ， 在 Sun 公 司 内 部 还 有 过 和 争 
论 ，HotSpot 打 败 Exact 并 不 能 算 技 术 上 的 胜利 ) ，HotSpot VM 的 热点 代 
码 探测 能 力 可 以 通过 执行 计数 器 找 出 最 具有 编译 价值 的 代码 ， 然 后 通知 
JIT 编 译 器 以 方法 为 单位 进行 编译 。 如 果 一 个 方法 被 频繁 调用 ， 或 方法 








中 有 效 循 环 次 数 很 多 ， 将 会 分 别 触及 标准 编译 和 OSR〈 栈 上 蔡 换 ) 编译 
动作 。 通 过 编译 器 与 解释 器 恰当 地 协同 工作 ， 可 以 在 最 优化 的 程序 啊 应 
时 间 与 最 佳 执行 性 能 中 取得 平衡 ， 而 且 无 须 等 待 本 地 代码 输出 才能 执行 
程序 ， 即 时 编译 的 时 间 压 力也 相对 减 小 ， 这 样 有 助 于 引入 更 多 的 代码 优 
化 技术 ， 和 输出 质量 更 高 的 本 地 代码 。 








在 2006 年 的 JavaOne 大 会 上 ，Sun 公 司 宣布 最 终 会 把 Java 开 源 ， 并 在 
随后 的 一 年 ， 陆 续 将 JDK 的 各 个 部 分 〈 其 中 当然 也 包括 了 HotSpot VM) 
在 GPL 协议 下 公开 了 源码 ， 并 在 此 基础 上 建立 了 OpenJDK。 这 样 ， 
HotSpot VM 便 成 为 了 Sun JDK 和 OpenJDK 两 个 实现 极度 接近 的 JDK 项 目 
的 共同 虚拟 机 。 


在 2008 年 和 2009 年 ，Oracle 公 司 分 别 收购 了 BEA 公 司 和 Sun 公 司 ， 
这 样 Oracle 就 同时 拥有 了 两 款 优 秀 的 Java 虚 拟 机 : JRockit VM 和 HotSpot 
VM。Oracle 公 司 宣布 在 不 久 的 将 来 《大约 应 在 发 布 JDK 8 的 时 候 ) 会 完 
成 这 两 款 虚 拟 机 的 整合 工作 ， 使 之 优势 互补 。 整 合 的 方式 大 致 上 是 在 
HotSpot 的 基础 上 ， 移 植 JRockit 的 优秀 特性 ， 壁 如 使 用 JRockit 的 垃圾 回 
收 器 与 MissionControl 服 务 ， 使 用 HotSpot 的 JIT 编 译 器 与 混合 的 运行 时 系 
统 。 


1.4.3 Sun Mobile-Embedded VM/Meta-Circular YM 


Sun 公 司 所 研发 的 虚拟 机 可 不 仅 有 前 面 介绍 的 服务 器、 和 更 面 领域 的 
商用 虚拟 机 ， 除 此 之 外 ，Sun 公 司 面 对 移动 和 和 巷 入 式 市 场 ， 也 发 布 过 虚 
拟 机 产品 ， 必 外 还 有 一 类 虚拟 机 ， 在 设计 之 初 就 没 抱 有 商用 的 目的 ， 仪 
仅 是 用 于 研究 、 验 证 茶 种 技术 和 观点 ， 又 或 者 是 作为 一 些 规范 的 标准 实 
现 。 这 些 虚拟 机 对 于 大 部 分 不 从 事 相 关 领 域 开 发 的 Java 程 序 员 来 说 可 能 
比较 陌生 。Sun 公 司 发 布 的 其 他 Java 虚 拟 机 有 : 


(1) KVM 





KVM 中 的 K 是 "Kilobyte" 的 意思 ， 它 强调 简单 、 轻 量 、 高 度 可 移 
植 ， 但 是 运行 速度 比较 慢 。 在 Android、iOS 等 智能 手机 操作 系统 出 现 前 
曾经 在 手机 平台 上 得 到 非常 广泛 的 应 用 。 








(2) CDC/CLDC HotSpot Implementation 


CDC/CLDC 全 称 是 Connected (Limited) Device Configuration， 在 
JSR-139/JSR-218 规 范 中 进行 定义 ， 它 希望 在 手机 、 电 子 书 、PDA 等 设备 
上 建立 统一 的 Java 编 程 接 口 ， 而 CDC-HI VM 和 CLDC-HI VM 则 是 它们 的 
一 组 参考 实现 。CDC/CLDC 是 整个 Java ME 的 重要 支柱 ， 但 从 目前 
Android 和 iOS 二 分 天 下 的 移动 数字 设备 市 场 看 来 ， 在 这 个 领域 中 ，Sun 





的 虚拟 机 所 面临 的 局 面 远 不 如 服务 器 和 和 覃 面 领域 乐观 。 
(3) Squawk YM 


Squawk VM 由 Sun 公 司 开 发 ， 运 行 于 Sun SPOT (Sun Small 
Programmable Object Technology， 一 种 手持 的 WiFi 设 备 ) ， 也 曾经 运用 
于 Java Card。 这 是 一 个 Java 代 码 比 重 很 高 的 家 入 式 虚 拟 机 实现 ， 其 中 诸 
如 类 加 载 器 、 字 节 码 验证 器 、 垃 圾 收集 器 、 解 释 器 、 编 译 器 和 线程 调度 
都 是 Java 语 言 本 身 完成 的 ， 仪 仅 靠 C 语 言 来 编写 设备 WO 和 必要 的 本 地 代 
但 。 








(4) JavaInJava 


JavaInJava 是 Sun 公 司 于 1997 年 ~1998 年 间 研 发 的 一 个 实验 室 性 质 的 
虚拟 机 ， 从 名 字 束 可 以 看 出 ， 它 试图 以 Java 语 言 来 实现 Java 语 言 本 身 的 
运行 环境 ， 既 所 谓 的 “元 循环 ”(Meta-Circular， 是 指使 用 语言 自身 来 实 








现 其 运行 环境 ) 。 它 必须 运行 在 男 外 一 个 窒 主 虚拟 机 之 上 ， 内 部 没有 
JIT 编 译 器 ， 代 码 只 能 以 解释 模式 执行 。 在 20 世 纪 末 主流 Java 虚 拟 机 都 未 
能 很 好 解决 性 能 问题 的 时 代 ， 开 发 这 种 项 目 ， 其 执行 速度 可 想 而 知 。 





(5) Maxine VM 


Maxine VM 和 和 上面 的 JavaInJava 韭 常 相似 ， 它 也 是 一 个 几乎 全 部 以 
Java 代 码 实 现 ( 只 有 用 于 启动 JVM 的 加 载 器 使 用 C 语 言 编 写 〉 的 元 循环 


Java 虚 拟 机 。 这 个 项 目 于 2005 年 开始 ， 到 现在 仍然 在 发 展 之 中 ， 比 起 
JavaInJava,Maxine VM 就 显得 “ 菲 谱 ” 很 多 ， 它 有 先进 的 JIT 编 译 避 和 垃圾 
收集 器 〈 但 没有 解释 器 ) ， 可 在 宿主 模式 或 独立 模式 下 执行 ， 其 执行 效 
率 已 经 接近 了 HotSpot Client VM 的 水 平 。 














1.4.4 BEA JRockiVIBM J9 VM 


前 面 介绍 了 Sun 公 司 的 各 种 虚拟 机 ， 除 了 Sun 公 司 以 外 ， 其 他 组 织 、 
公司 也 研发 过 不 少 虚 拟 机 实现 ， 其 中 规模 最 大 、 最 著名 的 束 是 BEA 和 
IBM 公 司 了 。 











JRockit VM 曾经 写 称 “世界 上 速度 最 快 的 Java 虚 拟 机 ”( 广 告 词 ， 貌 
似 J9 VM 也 这 样 说 过 ) ， 它 是 BEA 公 司 在 2002 年 从 Appeal Virtual 
Machines 公 司 收购 的 虚拟 机 。BEA 公 司 将 其 发 展 为 一 款 专门 为 服务 器 硬 
件 和 服务 器 端 应 用 场景 高 度 优化 的 虚拟 机 ， 由 于 专注 于 服务 器 端 应 用 ， 
它 可 以 不 太 关 注 程序 启动 速度 ， 因 此 JRockit 内 部 不 包含 解析 器 实现 ， 全 
部 代码 都 靠 即时 编译 器 编译 后 执行 。 除 此 之 外 ，JRockit 的 垃圾 收集 器 和 
MissionControl 服 务 套件 等 部 分 的 实现 ， 在 众多 Java 虚 拟 机 中 也 一 直 处 于 
领先 水 平 。 














IBM J9 VM 并 不 是 IBM 公 司 唯一 的 Java 虚 拟 机 ， 不 过 是 目前 其 主力 
发 展 的 Java 虚 拟 机 。IBM J9 VM 原本 是 内 部 开发 代号 ， 正 式 名 称 是 "IBM 
Technology for Java Virtual Machine"， 人 简称 IT4J， 只 是 这 个 名 字 太 掏 口 








了 一 点 ， 普 及 程度 不 如 J9。J9 VM 最 初 是 由 IBM Ottawa 实 验 室 一 个 名 为 
SmallTalk 的 虚拟 机 扩展 而 来 的 ， 当 时 这 个 虚拟 机 有 一 个 bug 是 由 8k 值 定 
义 错误 引起 的 ， 工 程 师 花 了 很 长 时 间 终 于 发 现 并 解决 了 这 个 错误 ， 此 后 


这 个 版 本 的 虚拟 机 就 称 为 K8 了 ， 后 来 扩展 出 支持 Java 的 虚拟 机 就 被 称 为 
J9 了 。 与 BEA JRockit 专 注 于 服务 器 端 应 用 不 同 ，IBM J9 的 市 场 定位 与 
Sun HotSpot 比 较 接近 ， 它 是 一 款 设计 上 从 服务 器 端 到 桌面 应 用 再 到 藤 入 
式 都 全 面 考虑 的 多 用 途 虚 拟 机 ，J9 的 开发 目的 是 作为 IBM 公 司 各 种 Java 
产品 的 执行 平台 ， 它 的 主要 市 场 是 和 IBM 产 品 (如 IBM WebSphere 等 ) 
搭配 以 及 在 IBM AIX 和 z/OS 这 些 平台 上 部 署 Java 应 用 。 








1.4.5 Azul VM/BEA Liquid VM 


我 们 平时 所 提 及 的 “高 性 能 Java 虚 拟 机 ”一 般 是 指 HotSpot、JRockit、 
J9 这 类 在 通用 平台 上 运行 的 商用 虚拟 机 ， 但 其 实 Azul VM 和 BEA Liquid 
VM 这 类 特定 硬件 平台 专 有 的 虚拟 机 才 是 “高 性 能 ”的 武器 。 


Azul VM 是 Azul Systems 公 司 在 HotSpot 基 础 上 进行 大 量 改进 ， 运 行 
于 Azul Systems 公 司 的 专 有 硬件 Vega 系 统 上 的 Java 虚 拟 机 ， 每 个 Azul 
VM 实 例 都 可 以 管理 至 少数 十 个 CPU 和 数 百 GB 内 存 的 硬件 资源 ， 并 提供 
在 巨大 内 存 范 围 内 实现 可 控 的 GC 时 间 的 垃圾 收集 器 、 为 专 有 硬件 优化 
的 线程 调度 等 优秀 特性 。 在 2010 年 ，Azul Systems 公 司 开 始 从 硬件 转向 
软件 ， 发 布 了 自己 的 Zing JVM， 可 以 在 通用 x86 平 台 上 提供 接近 于 Vega 
系统 的 特性 。 


Liquid YM 即 是 现在 的 JRockit VE (Virtual Edition) ， 它 是 BEA 公 司 
开发 的 ， 可 以 直接 运行 在 自家 Hypervisor 系 统 上 的 JRockit VM 的 虚拟 化 
版 本 ，Liquid VM 不 需要 操作 系统 的 支持 ， 或 者 说 它 自己 本 身 实现 了 一 
个 专用 操作 系统 的 必要 功能 ， 如 文件 系统 、 网 络 文 持 等 。 由 虚拟 机 越过 

通用 操作 系统 直接 控制 硬件 可 以 获得 很 多 好 处 ， 如 在 线程 调度 时 ， 不 需 
要 再 进行 内 核 态 /用 户 态 的 切换 等 ， 这 样 可 以 最 大 限度 地 发 挥 硬件 的 能 
力 ， 提 升 Java 程 序 的 执行 性 能 











1.4.6 ”Apache Harmony/Google Android Dalvik YM 


这 节 介 绍 的 Harmony VM 和 Dalvik YM 只 能 称 做 “虚拟 机 ”， 而 不 能 称 
做 “Java 虚 拟 机 ”， 但 是 这 两 款 虚 拟 机 《以 及 所 代表 的 技术 体系 ) 对 最 近 
几 年 的 Java 世 界 产生 了 非常 大 的 影响 和 挑战 ， 甚 至 有 些 翡 观 的 评论 家 认 
为 成 熟 的 Java 生 态 系统 有 骨 溃 的 可 能 


Apache Harmony 是 一 个 Apache 软 件 基 金 会 旗下 以 Apache License 协 
议 开 源 的 实际 兼容 于 JDK 1.5 和 JDK 1.6 的 Java 程 序 运 行 平 台 ， 这 个 介绍 
相当 白 口 。 它 包含 自己 的 虚拟 机 和 Java 库 ， 用 户 可 以 在 上 面 运行 
Eclipse、Tomcat、Maven 等 常见 的 Java 程 序 ， 但 是 它 没 有 通过 TCK 认 
证 ， 所 以 我 们 不 得 不 用 那么 一 长 串 掏 口 的 语言 来 介绍 它 ， 而 不 能 用 一 
句 “Apache 的 JDK” 来 说 明 。 如 果 一 个 公司 要 宣布 自己 的 运行 平台 “兼容 
于 Java 语 言 "， 那 就 必须 要 通过 TCK (Technology Compatibility Kit) 的 
兼容 性 测试 。Apache 基 金 会 曾 要求 Sun 公 司 提供 TCK 的 使 用 授权 ， 但 是 
一 直 遭 到 拒绝 ， 直 到 Oracle 公 司 收购 了 Sun 公 司 之 后 ， 双 方 关系 越 闹 越 
僵 ， 最 终 导 致 Apache 愤 然 退出 JCP (Java Community Process) 组 织 ， 这 

是 目前 为 止 Java 社 区 最 严重 的 一 次 “分 裂 ”。 





在 Sun 将 JDK 开 源 形 成 OpenJDK 之 后 ，Apache Harmony 开 源 的 优势 
被 极 大 地 削弱 ， 甚 至 连 Harmony 项 目的 最 大 参与 者 IBM 公 司 也 宣布 群 去 








Harmony 项 目 管 理 主席 的 职位 ， 并 参与 OpenJDK 项 目的 开发 。 虽 然 
Harmony 没 有 经 过 真正 大 规模 的 商业 运用 ， 但 是 它 的 许多 代码 (基本 上 
是 Java 库 部 分 的 代码 ) 被 吸纳 进 IBM 的 JDK 7 实现 及 Google Android SDK 
之 中 ， 尤 其 是 对 Android 的 发 展 起 到 了 很 大 的 推动 作用 。 














说 到 Android， 这 个 时 下 最 热门 的 移动 数码 设备 平台 在 最 近 几 年 间 
的 发 展 过 程 中 所 取得 的 成 果 已 经 远 远 超越 了 Java ME 在 过 去 十 多 年 所 获 
得 的 成 果 ，Android 让 Java 语 言 真正 走 进 了 移动 数码 设备 领域 ， 只 是 走 的 
并 非 Sun 公 司 原本 想象 的 那 一 条 路 。 


Dalvik VM 是 Android 平 台 的 核心 组 成 部 分 之 一 ， 它 的 名 字 来 源 于 冰 
岛 一 个 名 为 Dalvik 的 小 渔村 。Dalvik VM 并 不 是 一 个 Java 虚 拟 机 ， 它 没有 
遵循 Java 虚 拟 机 规范 ， 不 能 直接 执行 Java 的 Class 文 件 ， 使 用 的 是 寄存 器 
架构 而 不 是 JVM 中 常见 的 栈 架构 。 但 是 它 与 Java 又 有 着 千 丝 万 缕 的 联 
系 ， 它 执行 的 dex (Dalvik Executable) 文件 可 以 通过 Class 文 件 转化 而 
来 ， 使 用 Java 语 法 编写 应 用 程序 ， 可 以 直接 使 用 大 部 分 的 Java API 等 。 
目前 Dalvik VM 随 着 Android 一 起 处 于 迅猛 发 展 阶段 ， 在 Android 2.2 中 已 
提供 即时 编译 器 实现 ， 在 执行 性 能 上 有 了 很 大 的 提高 。 





1.4.7 ” “Microsoft JVM 及 其 他 


在 十 几 年 的 Java 虚 拟 机 发 展 过 程 中 ， 除 去 上 面 介 绍 的 那些 被 大 规模 
商业 应 用 过 的 Java 虚 拟 机 外 ， 还 有 许多 虚拟 机 是 不 为 人 知 的 或 者 
经 “绚丽 ?过 但 最 终 漂 灭 的 。 我 们 以 其 中 微软 公司 的 JVM 为 例 来 介绍 一 
hs 





也 许 Java 程 序 员 听 起 来 可 能 会 觉得 惊讶 ， 微 软 公司 曾经 是 Java 技 术 

的 铁杆 支持 者 〈 也 必须 承认 ， 与 Sun 公 司 争夺 Java 的 控制 权 ， 令 Java 从 跨 
平台 技术 变 为 绑 定 在 Windows 上 的 技术 是 微软 公司 的 主要 目的 ) 。 在 
Java 语 言 诞 生 的 初期 1996 年 ~1998 年 ， 以 JDK 1.2 发 布 为 分 界 ) ， 它 的 
主要 应 用 之 一 是 在 浏览 器 中 运行 Java Applets 程 序 ， 微 软 公司 为 了 在 IE3 
中 文 持 Java Applets 应 用 而 开发 了 自己 的 Java 虚 拟 机 ， 虽 然 这 款 虚 拟 机 只 
有 Windows 平 台 的 版 本 ， 却 是 当时 Windows 下 性 能 最 好 的 Java 虚 拟 机 ， 
它 在 1997 年 和 1998 年 连续 两 年 获得 了 《PC Magazine》 和 杂志 的 “编辑 选择 
奖 ”。 但 好 景 不 长 ， 在 1997 年 10 月 ，Sun 公 司 正 式 以 侵犯 商标 、 不 正当 竞 
争 等 罪名 控告 微软 公司 ， 在 随后 对 微软 公司 的 垄断 调查 之 中 ， 这 款 虚 拟 
机 也 曾 作 为 证 据 之 一 被 呈送 法 庭 。 这 场 官 司 的 结果 是 微软 公司 赔偿 2000 
万 美金 给 Sun 公 司 ( 最 终 微 软 公 司 因 秦 断 赔偿 给 Sun 公 司 的 总 金额 高 达 10 
亿美 元 ) ， 承 诺 终止 其 Java 虚 拟 机 的 发 展 ， 并 逐步 在 产品 中 移 除 Java 虚 
拟 机 相关 功能 。 具 有 讽刺 意味 的 是 ， 到 最 后 在 Windows XP SP3 中 Java 虚 








拟 机 被 完全 抹 去 的 时 候 ，Sun 公 司 却 又 到 处 登 报 希望 微软 公司 不 要 这 样 
做 站。Windows XP 高 级 产品 经 理 Jim Cullinan 称 : “我 们 花费 了 3 年 的 时 
间 和 Sun 打 官司 ， 当 时 他 们 试图 阻止 我 们 在 windows 中 支持 Java， 现 在 我 
们 这 样 做 了 ， 可 他 们 又 在 抱怨 ， 这 太 具 有 讽刺 意味 了 。” 


我 们 试想 一 下 ， 如 果 当 年 Sun 公 司 没有 起 诉 微软 公司 ， 微 软 公司 继 
续 保 持 着 对 Java 技 术 的 热情 ， 那 Java 的 世界 会 变 得 怎么 样 呢 ? .NET 技 术 
古人 否 会 发 展 起 来 ? 但 历史 是 没有 假设 的 。 其 他 在 本 节 中 没有 介绍 到 的 
Java 虚 拟 机 还 有 《当然 ， 应 该 还 有 很 多 笔者 所 不 知道 的 ) : 








JamVM. 


CaCaOVvm. 


SableV™M. 


Kaffe. 


Jelatine JVM. 


NanoVM. 


MRP. 


Moxie JVM. 


Jikes RVM. 


[iSun 公 司 在 《纽约 时 报 》、《 圣 约 琶 商业 新 闻 》 和 《华尔街 周刊 》 上 
刊登 了 整 页 的 广告 ， 在 广告 词 中 Sun 公 司 号 召 消 费 者 “要 求 微软 公司 继 


续 在 其 Windows XP 系统 包括 Java 平 台 ”。 


1.5 展望 Java 技 术 的 未 来 


在 2005 年 ，Java 语 言 诞 生 10 周 年 的 SunOne 技 术 大 会 上 ，Java 语 言 之 
父 James Gosling 做 了 一 场 题 为 “Java 技术 下 一 个 十 年 ”的 演讲 。 笔 者 不 具 
备 James Gosling 博 士 那样 高 屋 建 领 的 视角 ， 这 里 仅 从 Java 平 台中 几 个 新 
生 的 但 已 经 开始 展现 出 鞍 勃 之 势 的 技术 发 展 点 来 看 一 下 后 续 1~2 个 JDK 
版 本 内 的 一 些 很 有 希望 的 技术 重点 。 


1.5.1 模块 化 





模块 化 是 解决 应 用 系统 与 技术 平 合 越 来 越 复杂 、 越 来 越 庞大 问题 的 
一 个 重要 途径 。 无 论 是 开发 人 员 还 是 产品 最 终 用 户 ， 都 不 希望 为 了 系统 
中 一 小 块 的 功能 而 不 得 不 下 载 、 安 装 、 部 普及 维护 整套 庞大 的 系统 。 站 
在 整个 软件 工业 化 的 高 度 来 看 ， 模 块 化 是 建立 各 种 功能 的 标准 件 的 前 
握 。 最 近 几 年 0SGi 技 术 的 迅速 友 展 、 各 个 广 商 在 JCP 中 对 模块 化 规范 的 
激烈 斗争 5， 都 能 充分 说 明 横 块 化 技术 的 迫切 和 重要 。 














在 未 来 的 Java 平 台中 ， 很 可 能 会 对 模块 化 提出 语法 层面 的 支持 。 
在 2007 年 ，Sun 公 司 就 提出 过 JSR-277: Java 模 块 系统 (Java Module 
System ) ， 试 图 建立 Java 平 台 的 模块 化 标准 ， 但 受挫 于 以 IBM 公 司 为 主 
导 提 交 的 JSR-291: Java SE 动态 组 件 支 持 (Dynamic Component Support 


for Java SE， 这 实际 就 是 OSGi R4.1) 。 由 于 模块 化 规范 主导 权 的 重要 
性 ，Sun 公 司 不 能 接受 一 个 无 法 由 它 控制 的 规范 ， 在 整个 Java SE 6 期 间 
都 拒绝 把 任何 模块 化 技术 内 置 到 JDK 之 中 。 在 Java SE 7 发 展 初 期 ，Sun 
公司 再 次 提交 了 一 个 新 的 规范 请 求 文 档 JSR-294: Java 编 程 语 言 中 的 改 
进 模 块 性 支持 (Improved Modularity Support in the Java Programming 

Language) ， 尽 管 这 个 JSR 仍 然 没 有 通过 ， 但 是 Sun 公 司 已 经 独立 于 JCP 
专家 组 在 OpenJDK 里 建立 了 一 个 名 为 Jigsaw《〈 拼 图 ) 的 子 项 目 来 推动 这 
个 规范 在 Java 平 台中 转变 为 具体 的 实现 。Java 的 模块 化 之 争 目前 还 没有 
结束 ，OSGi 已 经 发 布 到 R5.0 版 本 ， 而 Jigsaw 从 Java 7 延迟 至 Java8， 在 
2012 年 7 月 又 不 得 不 宣布 推迟 到 Java 9 中 发 布 ， 从 这 点 看 来 ，Sun 在 这 场 
战争 中 处 于 劣势 ， 但 无 论 胜利 者 是 哪 一 方 ，Java 模 块 化 已 经 成 为 一 项 无 
法 阻挡 的 变革 潮流 。 








四 如 果 读 者 对 Java 模 块 化 之 争 感 兴趣 ， 可 以 阅读 笔者 的 另外 一 本 书 《 深 
入 理解 OSGi:Equinox 原 理 、 应 用 与 最 佳 实践 》 的 第 1 章 。 


当 单 一 的 Java 开 发 已 经 无 法 满足 当前 软件 的 复杂 需求 时 ， 越 来 越 多 
基于 Java 虚 拟 机 的 语言 开发 被 应 用 到 软件 项 目 中 ，Java 平 台 上 的 多 语言 
混合 编程 正成 为 主流 ， 每 种 语言 都 可 以 针对 自己 擅长 的 方面 更 好 地 解决 
问题 。 试 想 一 下 ， 在 一 个 项 目 之 中 ， 并 行 处 理 用 Clojure 语 言 编 写 ， 展 示 
层 使 用 JRuby/Rails， 中 间 层 则 是 Java， 每 个 应 用 层 都 将 使 用 不 同 的 编程 
语言 来 完成 ， 而 且 ， 接 口 对 每 一 层 的 开发 者 都 是 透明 的 ， 各 种 语言 之 间 
的 交互 不 存在 任何 困难 ， 就 像 使 用 自己 语言 的 原生 API 一 样 方便 中 ， 因 
为 它们 最 终 都 运行 在 一 个 虚拟 机 之 上 。 





在 最 近 的 几 年 里 ，Clojure、JRuby、Groovy 等 新 生 语言 的 使 用 人 数 
不 断 增长 ， 而 运行 在 Java 虚 拟 机 (JVM) 之 上 的 语言 数量 也 在 迅速 脱 
胀 ， 图 1-4 中 列举 了 其 中 的 一 部 分 。 这 两 点 证 明 混合 编程 在 我 们 身边 已 
经 有 所 应 用 并 被 广泛 认可 。 通 过 特定 领域 的 语言 去 解决 特定 领域 的 问题 
是 当前 软件 开发 应 对 日 趋 复杂 的 项 目 需求 的 一 个 方向 。 
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图 1-4 可 以 运行 在 JVM 之 上 的 语言 





除了 众生 出 大 量 的 新 语言 外 ， 许 多 已 经 有 很 长 历史 的 程序 语言 也 出 
现 了 基于 Java 虚 拟 机 实现 的 版 本 ， 这 样 使 得 混合 编程 对 许多 以 前 使 用 其 
他 语言 的 “ 老 ” 程 序 员 也 具备 相当 大 的 吸引 力 ， 软 件 企业 投入 了 大 量 资本 
的 现 有 代码 资产 也 能 很 好 地 保护 起 来 。 表 1-1 中 列举 了 常见 语言 的 VM 
实现 版 本 。 


语 言 
Ada 
AWK 
C 
Cobol 


表 1-1 


常见 语言 的 JVM 实现 版 本 


基于 JVM 实现 的 版 本 


JGNAT 
Jawk 


C to Java Virtual Machine compilers 


Veryant is Cobol 





ColdFusion 


Common Lisp 


Adobe ColdFusion、Railo、Open BlueDragon 


Armed Bear Common Lisp、CLforJava、Jatha (Common LISP) 





Component Pascal 


Gardens Point Component Pascal 








Erlang Erjang 

Forth myForth 
JavaScript Rhino 

LOGO jLogo、XLogo 
Lua Kahlua、Luaj、Jill 





Oberon-2 


Objective Caml (OCam!l) 


Canterbury Oberon-2 for JVM 


OCaml-Java 











Pascal Canterbury Pascal for JVM 

PHP IBM WebSphere sMash PHP (P8)、Caucho Quercus 
Python Jython 

Rexx IBM NetRexx 

Ruby JRuby 

Scheme Bigloo、Kawa、SISC、JScheme 


对 这 些 运行 于 Java 虚 拟 机 之 上 、Java 之 外 的 语言 ， 来 自 系统 级 的 、 


底层 的 支持 正在 迅速 增强 ， 以 JSR-292 为 核心 的 一 系列 项 目 和 功能 改进 

(如 Da Vinci Machine 项 目 、Nashorn 引 擎 、InvokeDynamic 指 令 、 
java.lang.invoke 包 等 ) ， 推 动 Java 虚 拟 机 从 “Java 语 言 的 虚拟 机 ”向 “多 语 
言 虚 拟 机 ”的 方向 发 展 。 


四 在 同一 个 虚拟 机 上 运行 的 其 他 语言 与 Java 之 间 的 交互 一 般 都 比较 容 
易 ， 但 非 Java 语 言 之 间 的 交互 一 般 都 比较 烦琐 。dynalang 项 目 
(http://dynalang.sourceforge.net/) 就 是 为 了 解决 这 个 问题 而 出 现 的 。 


[图片 来 源 : http://www.Slideshate.net/josebetomex/oow-2009-towards-a- 


universal-vm 。 


1.5.3 多核 并 行 





如 今 ，CPU 硬 件 的 发 展 方向 已 经 从 高 频率 转变 为 多 核心 ， 随 着 多 核 
时 代 的 来 临 ， 软 件 开 发 越 来 越 关注 并 行 编程 的 领域 。 早 在 JDK 1.5 就 已 
经 引入 java.utilconcurrent 包 实现 了 一 个 粗 粒度 的 并 发 框架 。 而 JDK 1.7 中 
加 入 的 java.util.concurrent.forkjoin 包 则 是 对 这 个 框架 的 一 次 重要 扩充 。 
Fork/Join 模 式 是 处 理 并 行 编程 的 一 个 经 典 方法 ， 如 图 1-5 所 示 。 昌 然 不 能 
解决 所 有 的 问题 ， 但 是 在 此 模式 的 适用 范围 之 内 ， 能 够 轻松 地 利用 多 个 
CPU 核心 提供 的 计算 资源 来 协作 完成 一 个 复杂 的 计算 任务 。 通 过 利用 
Fork/Join 模 式 ， 我 们 能 够 更 加 顺畅 地 过 渡 到 多 核 时 代 。 
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图 1-5 Fork/Join 模 式 示意 图 由 





在 Java 8 中 ， 将 会 提供 Lambda 文 持 ， 这 将 会 极 大 改善 目前 Java 语 言 


全 
会 
不 适合 函数 式 编程 的 现状 (目前 Java 语 言 使 用 函数 式 编程 并 不 是 不 可 











以 ， 只 是 会 显得 很 爱 肿 )， 函 数 式 编程 的 一 个 重要 优点 就 是 这 样 的 程序 
天 然 地 适合 并 行 运行 ， 这 对 Java 语 言 在 多 核 时 代 继 续 保 持 主 流 语言 的 地 
位 有 很 大 帮助 。 


另外 ， 在 并 行 计算 中 必须 提 及 的 还 有 OpenJDK 的 子 项 目 
Sumatral"1， 目 前 显卡 的 算术 运算 能 力 、 并 行 能 力 已 经 远 远 超过 了 CPU， 
在 图 形 领域 以 外 发 掘 显卡 的 潜力 是 近 几 年 计算 机 发 展 的 方向 之 一 ， 例 如 
C 语 言 的 CUDA。Sumatra 项 目 就 是 为 Java 提 供 使 用 GPU (Graphics 











Processing Units) 和 APU (Accelerated Processing Units) 运算 能 力 的 工 
具 ， 以 后 它 将 会 直接 提供 Java 语 言 层面 的 API， 或 者 为 Lambda 和 其 他 
JVM 语 言 提 供 底层 的 并 行 运 算 文 持 。 


在 JDK 外 围 ， 也 出 现 了 专 为 满足 并 行 计算 需求 的 计算 框架 ， 如 
Apache 的 Hadoop Map/Reduce， 这 是 一 个 简单 易 懂 的 并 行 框 架 ， 能 够 运 
行 在 由 上 二 个 商用 机 器 组 成 的 大 型 集群 上 ， 并 且 能 以 一 种 可 靠 的 容错 方 
式 并 行 处 理 TB 级 别 的 数据 集 。 另 外 ， 还 出 现 了 诸如 Scala、Clojure 及 
Erlang 等 天 生 就 具备 并 行 计算 能 力 的 语言 。 


[1 图 片 来 源 : http://www.ibm.com/developerworks/cn/java/j-lo- 
forkjoin/。 


[2JSumatra 项 目 主 页 : http://openjdk.java.net/projects/sumatra/。 


1.54， 进 三 步 夺 主语 法 


Java 5 曾经 对 Java 语 法 进行 了 一 次 扩充 ， 这 次 扩充 加 入 了 自动 装 
箱 、 泛 型 、 动 态 注解 、 枚 举 、 可 变 长 参数 、 遍 历 循环 等 语法 ， 使 得 Java 
语言 的 精确 性 和 易 用 性 有 了 很 大 的 进步 。 在 Java 7〈 由 于 进度 压力 ， 许 
多 改进 已 推迟 至 Java 8) 中 ， 对 Java 语 法 进行 了 另 一 次 大 规模 的 扩充 。 
Sun (已 被 Oracle 收 购 ) 专门 为 改进 Java 语 法 在 OpenJDK 中 建立 了 Coin 子 
项 目 中 来 统一 处 理 对 Java 语 法 的 细节 修改 ， 如 二 进 制 数 的 原生 支持 、 在 
switch 语 句 中 支持 字符 串 、“ 二 二 ”操作 符 、 异 常 处 理 的 改进 、 简 化 变 长 
参数 方法 调用 、 面 向 资源 的 try-catch-finally 语 句 等 都 是 在 Coin 项 目 之 中 


提交 的 内 容 。 








除了 Coin 项 目 之 外 ， 在 JSR-335 (Lambda Expressions for the Java 
TM Programming Language) 中 定义 的 Lambda 表 达 式 | 也 将 对 Java 的 语 
法 和 语言 习惯 产生 很 大 的 影响 ， 面 同 函 数 方式 的 编程 可 能 会 成 为 主流 。 


[1]Coin 项 目 主页 : http://wikis.sun.com/display/ProjectCoin/ Home。 


[2]Lambda 项 目 主页 : http://openjdk.java.net/projects/lambda/。 


1.5.5 64 位 虚拟 机 


在 几 年 之 前 ， 主 流 的 CPU 就 开始 支持 64 位 架构 了 。Java 虚 拟 机 也 在 
很 早 之 前 就 推出 了 支持 64 位 系统 的 版 本 。 但 Java 程 序 运 行 在 64 位 虚拟 机 
上 需要 付出 比较 大 的 额外 代价 ， 首先 是 内 存 问 题 ， 由 于 指针 膨胀 和 各 种 
数据 类 型 对 齐 补 白 的 原因 ， 运 行 于 64 位 系统 上 的 Java 应 用 需要 消耗 更 多 
的 内 存 ， 通 常 要 比 32 位 系统 额外 增加 10%~30% 的 内 存 消耗 其次， 多 
个 机 构 的 测试 结果 显示 ，64 位 虚拟 机 的 运行 速度 在 各 个 测试 项 中 几乎 全 
面 落后 于 32 位 虚拟 机 ， 两 者 大 约 有 15% 左 右 的 性 能 差距 。 














但 是 在 Java EE 方面 ， 企 业 级 应 用 经 常 需要 使 用 超过 4GB 的 内 存 ， 对 

于 64 位 虚拟 机 的 需求 是 非常 迫切 的 ， 但 由 于 上 述 原 因 ， 许 多 企业 应 用 都 
仍然 选择 使 用 虚拟 集群 等 方式 继续 在 32 位 虚拟 机 中 进行 部 署 。Sun 也 注 
意 到 了 这 些 问 题 ， 并 做 出 了 一 些 改善 ， 在 JDK 1.6 Update 14 之 后 ， 提 供 
普通 对 象 指 针 压 缩 功 能 〈-XX:+UseCompressedOops， 这 个 参数 不 建 

议 显 式 设 置 ， 建 议 维持 默认 由 虚拟 机 的 Ergonomics 机 制 自 动 开启 ) ， 在 
执行 代码 时 ， 动 态 植 入 压缩 指令 以 节省 内 存 消耗 ， 但 是 开局 压缩 指针 会 
增加 执行 代码 数量 ， 因 为 所 有 在 Java 堆 里 的 、 指 向 Java 堆 内 对 象 的 指针 
都 会 被 压缩 ， 这 些 指 针 的 访问 就 需要 更 多 的 代码 才 可 以 实现 ， 而 且 并 不 
只 是 读 写 字段 才 受 影响 ， 在 实例 方法 调用 、 子 类 型 检查 等 操作 中 也 受 影 
响 ， 因 为 对 象 实例 指向 对 象 类 型 的 引用 也 被 压缩 了 。 随 着 硬件 的 进一步 


























发 展 ， 计 算 机 终究 会 完全 过 渡 到 64 位 的 时 代 ， 这 是 一 件 毫 无 疑问 的 事 
情 ， 主 流 的 虚拟 机 应 用 也 终究 会 从 32 位 发 展 至 64 位 ， 而 虚拟 机 对 64 位 的 


支持 也 将 会 进一步 完善 。 





1.6 ”实战 .自己 编译 JDK 


想 要 一 探 JDK 内 部 的 实现 机 制 ， 最 便捷 的 路 径 之 一 就 是 自己 编译 一 
套 JDK， 通 过 阅读 和 跟 踩 调试 JDK 源 码 去 了 解 Java 技 术 体系 的 原理 ， 虽 
然 门槛 会 高 一 点 ， 但 肯定 会 比 阅 读 各 种 书籍 、 文 章 更 加 贴近 本 质 。 男 
外 ，JDK 中 的 很 多 底层 方法 都 是 本 地 化 〈Native) 的， 需要 跟踪 这 些 方 
法 的 运作 或 对 JDK 进 行 Hack 的 时 候 ， 都 需要 自己 编译 一 套 JDK。 








现在 网 络 上 有 不 少 开源 的 JDK 实 现 可 以 供 我 们 选择 ， 如 Apache 
Harmony、OpenJDK 等 。 考 虑 到 Sun 系 列 的 JDK 是 现在 使 用 得 最 广泛 的 
JDK 版 本 ， 笔 者 选择 了 OpenJDK 进 行 这 次 编译 实战 。 


1.6.1 ”获取 JDK 源 人 码 


首先 要 先 明确 OpenJDK 和 Sun/OracleJDK 之 间 ， 以 及 OpenJDK 6、 
OpenJDK 7、OpenJDK 7u 和 OpenJDK 8 等 项 目 之 间 是 什么 关系 ， 这 有 助 
于 确定 接 下 来 编译 要 使 用 的 JDK 版 本 和 源码 分 文 。 


从 前 面 介 绍 的 Java 发 展 史 中 我 们 了 解 到 OpenJDK 是 Sun 在 2006 年 末 
把 Java 开 源 而 形成 的 项 目 ， 这 里 的 “开源 ”是 通常 意义 上 的 源码 开放 形 
式 ， 即 源码 是 可 被 复 用 的 ， 例 如 IcedTeal、UltraVioletl ”1 都 是 从 
OpenJDK 源 码 入 生出 的 发 行 版 。 但 如 果 仅 从 “开源 ”字面 意义 开放 可 阅 


读 的 源码 ) 上 看 ， 其 实 Sun 自 JDK 1.5 之 后 就 开始 以 Java Research 
License (JRL) 的 形式 公布 过 Java 源 码 ， 主 要 用 于 研究 人 员 阅 读 (JRL 
许可 证 的 开放 源码 至 JDK 1.6 Update 23 为 止 〉》”。 把 这 些 JRL 许 可 证 形式 
的 Sun/OracleJDK 源 码 和 对 应 版 本 的 OpenJDK 源 人 码 进行 比较 ， 发 现 除了 
文件 头 的 版 权 注释 之 外 ， 其 余 代码 基本 上 都 是 相同 的 ， 只 有 字体 演 染 前 
分 存在 一 点 差异 ，Oracle JDK 采 用 了 商业 实现 ， 而 OpenJDK 使 用 的 是 开 
源 的 FreeType。 当 然 , “相同 ”是 建立 在 两 者 共有 的 组 件 基 础 上 的 ， 
Oracle JDK 中 还 会 存在 一 些 Open JDK 没 有 的 、 商 用 闭 源 的 功能 ， 例 如 从 
JRockit 移 植 改 造 而 来 的 Java Flight Recorder。 预 计 以 后 JRockit 的 
MissionControl 移 植 到 HotSpot 之 后 ， 也 会 以 Oracle JDK 专 有 、 闭 源 的 形 
式 提 供 。 








Oracle 的 项 目 发 布 经 理 Joe Darcy 在 OSCON 2011 上 对 两 者 关系 的 介 
绍 Bl 也 证 实 了 OpenJDK 7 和 Oracle JDK 7 在 程序 上 是 非常 接近 的 ， 两 者 共 
用 了 大 量 相 同 的 代码 (如 图 1-6 所 示 ， 注 意图 中 提示 了 两 者 共同 代码 的 
占 比 要 远 高 于 图 形 上 看 到 的 比例 ) ， 所 以 我 们 编译 的 OpenJDK， 基 本 上 
可 以 认为 性 能 、 功 能 和 执行 逻辑 上 都 和 官方 的 Oracle JDK 是 一 致 的 。 








“We have a lot in common.” 


Note: figure not drawn to Scale. 
More sharing than pictured. 
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图 1-6 OpenJDK 和 Oracle JDK 之 间 的 关系 


再 来 看 一 下 OpenJDK 6、OpenJDK 7、OpenJDK 7u 和 OpenJDK 8 这 
几 个 项 目 之 间 的 关系 ， 从 图 1-7〔( 依 然 是 从 Joe Darcy 的 OSCON 2011 演 示 
稿 中 截取 的 图 片 ) 来 看 ，OpenJDK 7 是 始 于 JDK 6 时 期 ， 当 时 JDK 6 和 
JDK 6 Update 1 已 经 发 布 ，JDK 7 已 经 开始 研发 了 ， 所 以 OpenJDK 7 是 直 
接 基于 正在 研发 的 JDK 7 源码 建立 的 。 但 考虑 到 OpenJDK 7 的 状况 在 当 
时 还 不 适合 实际 生产 部 署 ， 因 此 在 OpenJDK 7 Build 20 的 基础 上 建立 了 
OpenJDK 6 分 支 ， 剥 离 掉 JDK 7 新 功能 的 代码 ， 形 成 一 个 可 以 通过 TCK 6 
测试 的 独立 分 支 。 


JDK 8 


httpi/hg.openjdk.java.net/dk8/jdk8 


id et IDK 
JDK 7 b11... b20 ..b147 JDK 7u1 


http://hg.openjdk .java.netidk7u/ljdk7u/ 


JDK6 JDK 6 bo01... b23... 


6u1 6u4 6u10 6u26 


图 1-7 OpenJDK 6、OpenJDK7、OpenJDK 7u、OpenJDK 8 之 间 的 关 
系 


2012 年 7 月 ，JDK 7 正式 发 布 ， 在 OpenJDK 中 也 同步 建立 了 OpenJDK 
7 Update 项 目 对 JDK 7 进行 更 新 升级 ， 以 及 OpenJDK 8 项 目 开 始 下 一 个 
JDK 大 版 本 的 研发 。 按 照 开 发 习惯 ， 新 的 功能 或 Bug 修 复 通 常 是 在 最 新 
分 文 上 进行 的 ， 当 功能 或 修复 在 最 新 分 支 上 稳定 之 后 会 同步 到 其 他 老 版 
本 的 维护 分 支 上 。 














OpenJDK 6、OpenJDK 7、OpenJDK 7u 和 OpenJDK 8 的 源码 都 可 以 
在 它们 相应 的 网 页 上 找到 ， 在 本 次 编译 实践 中 ， 笔 者 选用 的 项 目 是 
OpenJDK 7u， 版 本 为 7u6。 


获取 OpenJDK 源 码 有 两 种 方式 ， 其 中 一 种 是 通过 Mercurial 代 码 版 本 
管理 工具 从 Repository 中 直接 取得 源码 (Repository 地 址 : 
http:/hg.openjdk.java.neUjdk7ujdk7u) ， 获 取 过 程 如 以 下 代码 所 示 。 





hg clone http://hg.openjdk.java.net/jdk7u/jdk7u-dev 
cd jdk7u-dev 

chmod 755 get source.sh 

./get source.sh 








这 是 最 直接 的 方式 ， 从 版 本 管理 中 看 变更 轨迹 比 看 Release Note 效 
果 更 好 。 但 不 足 之 处 是 速度 太 慢 ， 虽 然 代 码 总 容量 只 有 300 MB 左右 ， 
但 是 文件 数量 太 多 ， 在 笔者 的 网 络 下 全 部 复制 到 本 地 需要 数 小 时 。 男 
外 ， 考 虑 到 Mercurial 不 如 Git、SVN、ClearCase 或 CVS 之 类 的 版 本 控制 
工具 那样 普及 ， 对 于 一 般 读者 ， 建 议 采 用 第 二 种 方式 ， 即 直接 下 载 官方 
打包 好 的 源码 包 ， 读 者 可 以 从 Source Bundle Releases 页 面 ( 地 址 : 
http:/jdk7.java.net/source.html) 取得 打包 好 的 源码 ， 到 本 地 直接 解压 即 
可 。 一般 来 说 ， 源 码 包 大 概 一 至 两 个 月 左右 会 更 新 一 次 ， 虽 然 不 够 及 
时 ， 但 比 起 从 Mercurial 复制 代码 的 确 方便 和 快捷 许多 。 笔 者 下 载 的 是 
OpenJDK 7 Update 6 Build b21 版 源码 包 ，2012 年 8 月 28 日 发 布 ， 大 概 
99MB， 解 压 后 约 为 339MB。 








[IcedTea: http://icedtea.classpath.org/wiki/Main_ Page。 
[2]UltraViolet: https://www.reservoit.com/? d=uvform/form.。 
D 全 文 地 址 : 


https:/ /blogs.oracle.com/darcy/resource/OSCON/oscon2011_OpenJDKState. 


1.6.2 ”系统 需求 


如 果 可 能 ， 笔 者 建议 尽量 在 Linux、MacOS 或 Solaris 上 构建 
OpenJDK， 这 要 比 在 Windows 平 台 上 容易 得 多 ， 本 章 实 战 中 笔者 将 以 
Ubuntu 10.10 和 MacOS X 10.8.2 为 例 进行 构建 。 如 果 读 者 一 定 要 在 
Windows 平 台 上 完成 编译 ， 可 参考 本 书 附录 A， 该 附录 是 本 书 第 一 版 中 
介绍 如 何在 Windows 下 编译 OpenJDK 6 的 例子 ， 原 有 的 部 分 内 容 现在 已 
经 过 时 了 《例如 安装 Plug 部 分 ) ， 但 还 是 有 一 定 参考 意义 ， 因 此 笔者 没 
有 把 它 删 除 掉 ， 而 是 移 到 附录 之 中 。 























无 论 在 什么 平台 下 进行 编译 ， 都 建议 读者 认真 阅读 一 所 源码 中 的 
README-builds.html 文 档 (无 论 在 OpenJDK 网 站 上 还 是 在 下 载 的 源码 包 
中 都 有 这 份 文档 〉， 因 为 编译 过 程 中 需要 注意 的 细节 非常 多 。 虽 然 不 至 
于 像 文档 上 所 描述 的 “Building the source code for the JDK requires a high 





level of technical expertise.Sun provides the source code primarily for 

technical experts who want to conduct research. (编译 JDK 需 要 很 高 的 专业 
技术 ，Sun 提 供 JDK 源 码 是 为 了 技术 专家 进行 研究 之 用 ) ”那么 硅 张 ， 但 
是 如 果 读 者 是 第 一 次 编译 ， 那 有 可 能 会 在 一 些小 问题 上 耗费 许多 时 间 。 


在 本 次 编译 中 采用 的 是 64 位 操作 系统 ， 编 译 的 也 是 64 位 的 
OpenJDK， 如 果 需 要 编译 32 位 版 本 ， 那 建议 在 32 位 操作 系统 上 进行 。 在 


官方 文档 上 写 到 编译 OpenJDK 公 少 需 要 512MB 的 内 存 和 600MB 的 磁盘 空 
间 。512MB 的 内 存 也 许 能 凑合 使 用 ， 不 过 600MB 的 磁盘 空间 估计 仅 是 指 
存放 OpenJDK 源 码 所 需 的 空间 ， 要 完成 编译 ，600MB 肯 定 是 无 论 如何 都 
不 够 的 ， 光 输出 的 编译 结果 就 有 近 3GB 〈 因 为 有 很 多 中 间 文 件 ， 以 及 会 
编译 出 不 同 优化 级 别 (Product、Debug、FastDebug 等 ) 的 虚拟 机 ) ， 建 
议 读者 至 少 保证 5GB 以 上 的 空余 磁盘 。 





对 系统 的 最 后 一 点 要 求 就 是 所 有 的 文件 ， 包 括 源码 和 依赖 项 目 ， 都 
不 要 放 在 包含 中 文 的 目录 里 面 ， 这 样 做 不 是 一 定 不 可 以 ， 只 是 没有 必要 
给 自己 找 麻烦 ， 





1.6.3 构建 编译 环境 


在 MacOSI 和 Linux 上 构建 OpenJDK 编 译 环境 比较 简单 〈 相 对 于 
Windows 来 说 ) ， 对 于 Mac OS， 需 要 安装 最 新 版 本 的 XCode 和 Command 
Line Tools for XCode， 在 Apple Developer 网 站 

(https://developer.apple.com/) 上 可 以 免费 下 载 ， 这 两 个 SDK 包 提供 了 
OpenJDK 所 需 的 编译 器 以 及 Makefile 中 用 到 的 外 部 命令 。 另 外 ， 还 要 准 
备 一 个 6ul14 以 上 版 本 的 JDK， 因 为 OpenJDK 的 各 个 组 成 部 分 (Hotspot、 
JDK API、JAXWS、JAXP.……:) 有 的 是 使 用 C++ 编写 的 ， 更 多 的 代码 
则 是 使 用 Java 自 身 实 现 的 ， 因 此 编译 这 些 Java 代 码 需要 用 到 一 个 可 用 的 
JDK， 官 方 称 这 个 JDK 为 "Bootstrap JDK"。 如 果 编 译 OpenJDK 7， 
Bootstrap JDK 必 须 使 用 JDK6 Update 14 或 之 后 的 版 本 ， 笔 者 选用 的 是 
JDK7 Update 4。 最 后 需要 下 载 一 个 1.7.1 以 上 版 本 的 Apache Ant， 用 于 执 
行 Java 编 译 代码 中 的 Ant 脚 本 。 


对 于 Linux 来 说 ， 所 需要 准备 的 依赖 与 Mac OS 差不多 ，Bootstrap 
JDK 和 Ant 都 是 一 样 的 ， 在 Mac 0OS 中 GCC 编译 器 来 源 于 XCode SDK， 而 
Ubuntu 中 GCC 应 该 是 默认 安装 好 的 ， 需 要 确保 版 本 为 4.3 以 上 ， 如 果 没 
有 找到 GCC， 安 装 binutils 即 可 ， 在 Ubuntu 10.10 下 编译 OpenJDK 7u4 所 
需 的 依赖 可 以 使 用 以 下 命令 一 次 安装 完成 。 





sudo apt-get install build-essential gawk m4 openjdk-6-jdk 





libasound2-dev libcups2-dev libxrender-dev xorg-dev xutils-dev 
xllproto-print-dev binutils libmotif3 libmotif-dev ant 




















[1 


注意 ， 只 有 在 OpenJDK 7u4 和 之 后 的 版 本 才能 编译 出 Mac OS 系统 下 的 
包 ， 之 前 的 版 本 虽然 在 源码 和 编译 脚本 中 也 包含 了 Mac OS 目录 ,但 
尚未 完善 


>» 


1.6.4 ”进行 编译 


现在 需要 下 载 的 编译 环境 和 依赖 项 目 都 准备 齐全 了 ， 最 后 我 们 还 需 
要 对 系统 的 环境 变量 做 一 些 简 单 设 置 以 便 编 译 能 够 顺利 通过 。OpenJDK 
在 编译 时 读 取 的 环境 变量 有 很 多 ， 但 大 多 都 有 默认 值 ， 必 须 设 置 的 只 有 
两 个 : LANG 和 ALT_BOOTDIR， 前 者 是 设 定语 言 选项 ， 必 须 设置 为 : 














export LANG=C 





人 否则， 在 编译 结束 前 的 验证 阶段 会 出 现 一 个 HashTable 内 的 空 指针 
异常 。 另 外 一 个 ALT_BOOTDIR 参 数 是 前 面 提 到 的 Bootstrap JDK， 在 
Mac OS 上 笔者 设 为 以 下 路 径 ， 其 他 操作 系统 读者 对 应 调整 即 可 。 





export 
ALT BOOTDIR=/Library/Java/JavaVirtualMachines/jdk1.7.0 04.jdk/Content: 

















另外 ， 如 果 读 者 之 前 设置 了 JAVA_HOME 和 CLASSPATH 两 个 环境 
变量 ， 在 编译 之 前 必须 取消 ， 否 则 在 Makefile 脚 本 中 检查 到 有 这 两 个 变 


量 存在 ， 会 有 警告 提示 。 





unset JAVA HOME 
unset CLASSPATH 











其 他 环境 变量 笔者 就 不 再 一 一 介绍 了 ， 代 码 清单 1-1 给 出 笔者 自己 


常用 的 编译 Shell 脚 本 ， 读 者 可 以 参考 变量 注释 中 的 内 容 。 


代码 清单 1-1 环境 变量 设置 











# 语 言 选项 ， 这 个 必须 设置 ， 和 否则 编译 好 后 会 出 现 一 个 HashTable 的 NPE 错 
export LANG=C 
#Bootstrap JDK 的 安装 路 径 。 必 须 设置 
export 
ALT BOOTDIR=/Library/Java/JavaVirtualMachines/jdk1.7.0 04.jdk/Content: 
# 人 允许 自动 下 载 依赖 
export ALLOW DOWNLOADS=true 
# 并 行 编译 的 线程 数 ， 设 置 为 和 CPU 内 核 数 量 一 致 即 可 
export HOTSPOT BUILD JOBS=6 
export ALT PARALLEL COMPILE JOBS=6 
# 比 较 本 次 build 出 来 的 映像 与 先前 版 本 的 差异 。 这 对 我 们 来 说 没有 意义 
# 必 须 设置 为 false， 否 则 sanity 检 查 会 报 缺 少 先 前 版 本 JDK 的 映像 的 错误 提示 。 
# 如 果 已 经 设置 dev 或 者 DEV_ONLY=true， 这 个 不 显 式 设置 也 行 
export SKIP COMPARE IMAGES=true 


# 使 用 预 5 0 不 加 这 个 编译 会 更 慢 一 些 



















































































































































































export EE PRECOMPILED HEADER=true 
要 编 衣 的 内 容 
export BUILD LANGTOOLS=true 
































#export BUILD JAXP=false 
#export BUILD JAXWS=false 
#export BUILD CORBA=false 














export BUILD HOTSPOT=tirue 
export BULLD. JDR=true 







































































# 要 编译 的 版 本 

#export SKIP DEBUG BUILD=false 
#export SKIP FASTDEBUG BUILD=true 
#export DEBUG NAME=debug 





























# 把 它 设置 为 false 可 以 避 开 javaws 和 浏览 器 Java 插 件 之 类 的 部 分 的 puilqd 

BUILD DEPLOY=false 

# 把 它 设置 为 false 就 不 会 pui1d 出 安装 包 。 因 为 安装 包 里 有 些 奇 怪 的 依赖 ， 

# 但 即便 不 build 出 它 也 已 经 能 得 到 完整 的 JDK 映 像 ， 所 以 还 是 别 buila 它 好 了 

BUILD INSTALL=false 
# 编 译 结果 所 存放 的 路 径 
export 

2 7u4/build 
# 这 两 个 环境 变量 必须 去 挥 ， 不 然 会 有 很 诡异 的 事情 发 生 ( 我 没有 有 具体 查 过 这 些 " 奖 异 的 
# 事 情 "，Makefile 脚 本 检查 到 有 这 2 个 变量 就 会 提示 警告 ) 
unset JAVA HOME 
unset CLASSPATH 
make 2>&1|tee $ALT OUTPUTDIR/build.1og 


















































































































































全 部 设置 结束 之 后 ， 可 以 输入 make sanity 来 检查 我 们 前 面 所 做 的 设 


置 是 否 全 部 正确 。 如 果 一 切 顺 利 ， 那 么 几 秒 钟 之 后 会 有 类 似 代 码 清单 1- 
2 所 示 的 输出 。 


代码 清单 1-2 make sanity 检 查 


~/Develop/JVM/jdk 
Build Machine Informa 
build machine=] 
Build Directory Struc 





























Build/openjdk 7u4$make sanity 
tion: 


BP .local 





[cyFenix-RM 











CWD=/Users/] 


TOPDIR= 





LANGTOOLS TOPD] 
JAXP TOPD] 
JAXWS TOPDIR=./jaxws 
CORBA TOPDIT 
HOTSPOT TOPD] 











JDK TOPD] 

















[R=./jdk 
uild Directives: 
































Ti Ct CE CH EC 





ILD LANGTOOLS=true 
ILD JAXP=true 
ILD JAXI 
ILD CORBA=true 

iLD HOLSPOT=tEUS 
ILD JDK= 
EBUG CLASSFILES= 





S=true 


Lrue 














BR 
RB 
RB 
RB 
B 
RB 
RB 
D 
D 








EBUG BINARIES= 























REETYPE 



































REETYPE 


O 

F = 

ALT FREETYPE HEADERS PATH= 
F B_PATH=/usr/X11R6/1ib 


























ALT_FREETYPE LIB PATH= 
Previous JDK Settings: 
ELEASE PATH=US] 





REV 





US _ 





LT PREV 














LT PREV 

















REVIOUS 











P O 
ALT PR 
PREVIOUS 
A R 
P O 











ALT PREVT 








工 








R=. /corba 
[R=. /hotspot 





ture: 
[cyFenix/Develop/JVM/jdkBuild/openjdk 7u4 





[R=./langtools 
[R=. /jaxp 


a 因 篇 幅 关 系 ， 中 间 省 略 了 大 量 的 输出 内 容 …. 
PenJUDK-sSspecii 
R EADERS PATH=/usr/X11R6/include 


fic settings: 








[NG-PREVIOUS RELEASE IMAGE 








US RELEAS 














DK VERS 














DK FILE= 
US JDK F 


























US JDK VEI 


















































P_ PATH= 
1.6.0 




























































































PREVIOUS JRE FILE= 
ALT PREVIOUS JRE FILE= 

PREVIOUS RELEASE IMAGE=/Library/Java/JavaVirtualMachines/jdk1.7.0_ 
ALT PREVIOUS RELEASE IMAGE= 





























Sanity check passed. 





Makefile 的 Sanity 检 查 过 程 输出 了 编译 所 需 的 所 有 环境 变量 ， 如 果 看 
到 "Sanity check passed."， 说 明 检 查 过 程 通过 了 ， 可 以 输入 "make" 执 行 整 
个 OpenJDK 编 译 (make 不 加 参数 ， 默 认 编 译 make all) ， 笔 者 使 用 Core 
i7 3720QM/16GB RAM 的 MacBook 机 器 ， 局 动 6 条 编译 线程 ， 全 量 编译 
整个 OpenJDK 大 概 需 20 分 钟 ， 编 译 结束 后 ， 将 输出 类 似 下 面 的 日 志清 单 
所 示 内 容 。 如 果 读 者 之 前 已 经 全 量 编译 过 ， 只 修改 了 少量 文件 ， 增 量 编 
译 可 以 在 数 十 秒 内 完成 。 

















#--Build times----------— 
Target all product build 
SEart ZOLZ-L2 3 LL 
































End 2012-12-13 17:31507 
O00OLEs: 19. Corba 

00:01:15 hotspot 
00:00:14 jaxp 

00%71:21. Jaxws 

QO0%83 4 可 UE 


00:00:28 langtools 
00:18:48 TOTAL 








编译 完成 之 后 ， 进 入 OpenJDK 源 码 下 的 build/j2sdk-image 目 录 ( 或 
者 build-debug、build-fastdebug 这 两 个 目录 ) ， 这 是 整个 JDK 的 完整 编译 
结果 ， 复 制 到 JAVA_HOME 目 录 ， 就 可 以 作为 一 个 完整 的 JDK 使 用 ， 编 


译 出 来 的 虚拟 机 ， 在 -version 命 令 中 带 有 用 户 的 机 器 名 。 





>./java-version 

openjdk version"1.7.0-internal-fastdebug" 

OpenJDK Runtime Environment (buildl.7.0-internal-fastdebug- 
icyfenix 2012 12 24 15 57-b00) 

OpenJDK 64-Bit Server VM (build 23.0-b21-fastdebug,mixed mode) 



































在 大 多 数 时 候 ， 如 果 我 们 并 不 关心 JDK 中 HotSpot 虚 拟 机 以 外 的 内 
容 ， 只 想 单独 编译 HotSpot 虚 拟 机 的 话 ( 例 如 调试 虚拟 机 时 ， 每 次 改动 
程序 都 执行 整个 OpenJDK 的 Makefile， 速 度 肯定 受 不 了 ) ， 那 么 使 用 
hotspotmake 目 录 下 的 Makefile 进 行 蔡 换 即 可 ， 其 他 参数 设置 与 前 面 是 一 
致 的 ， 这 时 候 虚拟 机 的 输出 结果 存放 在 
build/hotspotyoutputdivbsd_amd64_compiler2 目 录 员 中 ， 进 入 后 可 以 见 到 
以 下 几 个 目录 。 














































































































0 drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 debug 

0 drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 fastdebug 
0 drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:25 generated 
0 drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 jvmg 

0 drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 optimized 
0 drwxr-xr-x 584 IcyFenix staff 19K 12 13 17:25 product 

0 drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 profiled 





这 些 目录 对 应 了 不 同 的 优化 级 别 ， 优 化 级 别 越 高 ， 性 能 自然 就 越 
好 ， 但 是 输出 代码 与 源码 的 差距 束 越 大 ， 难 于 调试 ， 基 体 哪 个 目录 有 内 
容 ， 取 决 于 make 命 令 后 面 的 参数 。 








在 编译 结束 之 后 、 和 运行 虚拟 机 之 前 ， 还 要 手工 编辑 目录 下 的 env.sh 





文件 ， 这 个 文件 由 编译 脚本 上 自动 产生 ， 用 于 设置 虚拟 机 的 环境 变量 ， 里 
面 已 经 发 布 了 "JAVA_HOME、CLASSPATH、 





HOTSPOT BUILD_ USER"3 个 环境 变量 ， 还 需要 增加 一 
个 "LD LIBRARY PATH"， 内 容 如 下 : 





LD LIBRARY PATH=.:${JAVA HOME}/jre/lipb/amd64/native threads:${JAVA 
export LD LIBRARY PATH 


























然后 执行 以 下 命令 启动 虚拟 机 《这 时 的 启动 器 名 为 gamma) ， 输 出 
版 本 号 。 





../env.sh 
./gamma-version 
Using java runtime 
at:/Library/Java/JavaVirtualMachines/jdk1.7.0 04.jdk/Contents/Home/jre 
java version"1.7.0 04" 
Java (TM) SE Runtime Environment (build 1.7.0 04-b21) 
OpenJDK 64-Bit Server VM (build 23.0-b21, mixed mode) 

















看 到 上 自己 编译 的 虚拟 机 成 功 运行 起 来 ， 很 有 成 就 感 吧 ! 


上 在 不 同 机 器 上 ， 最 后 一 个 目录 名 称 会 有 所 差别 ，bsd 表 示 Mac OS 系统 
(内 核 为 FreeBSD) ，amd64 表 示 是 64 位 JDK (32 位 是 x86) ，compiler2 表 


示 是 Setrver VM (Client VM 表示 是 compiler1) 。 


1.6.5 在 IDE 工 具 中 进行 源码 调试 





在 阅读 OpenJDK 源 码 的 过 程 中 ， 经 常 需要 运行 、 调 试 程序 来 帮助 理 
解 。 我 们 现在 已 经 可 以 编译 出 一 个 调试 版 本 HotSpot 虚 拟 机 ， 禁 用 优 
化 ， 并 带 有 符号 信息 ， 这 样 就 可 以 使 用 GDB 来 进行 调试 了 。 据 笔者 了 
解 ， 许 多 对 虚拟 机 了 解 比较 深 的 开发 人 员 确实 就 是 直接 使 用 GDB 加 VIM 
编辑 器 来 开发 、 修 改 HotSpot 的 ， 不 过 相信 大 部 分 读者 更 倾向 于 在 IDE 环 
境 而 不 是 纯 文 本 的 GDB 下 了 阅读、 跟踪 HotSpot 源 码 ， 因 此 这 节 就 简单 介 
绍 一 下 “如 何在 IDE 中 进行 HotSpot 源 码 调 试 ”。 














首先 ， 到 NetBeans 网 站 (http://netbeans.org/〉 上 下 载 最 新 版 的 
NetBeans， 下 载 时 选择 支持 C/C++ 开发 的 那个 版 本 。 安 装 后 ， 新 建 一 个 
项 目 ， 选 择 “ 基 于 现 有 源 代码 的 C/C++ 项 目 ”， 在 源码 文件 夹 中 填 入 
OpenJDK 目 录 下 hotspot 目 录 的 路 径 ， 在 下 面 的 单 选 按钮 中 选择 “定制 ”， 
如 图 1-8 所 示 ， 然 后 单 击 “ 下 一 步 ” 按 钮 。 


指定 包含 现 有 源 代码 的 文件 夹 (E): 
(Develop/JVM/jdkBuild/openjdk_7u4/hotspot v| | 浏览 W)...， | 
构建 主机 (B): | localhost 











工具 集合 (D: | 默认 (CNU (GNU Mac 编译 器 集合 ) 


选择 配置 模式 (M): 
O) 自动 (使 用 Makefile)(A) 
(©) 定制 (C) 

在 "定制 "模式 下 , 可 以 查看 和 更 改 用 于 配置 项 目的 设置 。 








| 帮助 H) |] | < 上 一 步 B) | 


图 1-8 在 NetBeans 中 创建 HotSpot 项 目 (1) 





接着 ， 在 “指定 构建 代码 的 方法 ”中 选择 “使 用 现 有 的 makefile"”， 并 
填 入 Makefile 文 件 的 路 径 〈 在 hotspoVymake 目 录 下 ) ， 如 图 1-9 所 示 。 单 
击 “ 下 一 步 ?按钮 ， 将 “构建 命令 ”修改 为 以 下 内 容 : 

















${MAKE}-f Makefile clean jvmg 
ALT BOOTDIR=/Library/Java/JavaVirtualMachines/jdk1.7.0 04.jdk/Cont 
ARCH DATA MODEL=64 LANG=C 




















新 建 项 目 
构建 工具 
: 指定 构建 代码 的 方法 。 
E Se (*) 使 用 现 有 的 makefile(M) 
me 现 有 的 Makefile(E): lopenjdk_7u4/hotspot/jmake/Makefile | 浏览 (R)..…. 
. 代码 帮助 配置 [VY 完成 后 清理 并 生成 (D) 
5 C 〇 使 用 配置, 脚本 生成 的 makefile(C) 
配置 性 本 (9) 


生成 的 Makefile(G) 
可 完 成 后 运行 配置 法 本 (R) 


选择 "使 用 现 有 的 makefile", 然后 指定 现 有 的 makefile 可 以 构建 代码 。 选 择 "使 用 配 
置 脚 本 构建 的 makefile" 可 以 使 用 现 有 配置 脚本 构建 makefile, 从 而 构建 代码 。 


帮助 (H) | < 上 一 步 (B) 








图 1-9 在 NetBeans 中 创建 HotSpot 项 目 (2) 


OpenJDK 7u4 源 码 Makefile 在 终端 运行 时 能 正确 获取 到 系统 指令 集 
架构 为 64 位 ， 但 在 NetBeans 中 却 没 有 取得 正确 的 值 ， 误 认为 是 32 位 ， 
此 这 里 必须 使 用 ARCH_DATA_MODEL 参 数 明确 指定 为 64 位 。 另 外 两 个 
参数 ALT_BOOTDIR 和 LANG 的 作用 前 面 已 经 介绍 过 。 单 击 “ 完 成 ” 按 


钮 ，HotSpot 项 目 就 这 样 导 入 到 NetBeans 中 了 。 





不 过 ， 这 时 候 HotSpot 还 运行 不 起 来 ， 因 为 NetBeans 根 本 不 知道 编 
译 出 来 的 结果 放 在 哪里 、 哪 个 程序 是 虚拟 机 的 入 口 等 ， 这 些 内 容 都 需要 
明确 告知 NetBeans。 在 HotSpot 工 程 上 单 击 右键 ， 在 弹出 的 快捷 菜单 中 





选择 “属性 ”， 在 弹出 的 对 话 框 中 找到 “运行 * 选 项， 设置 运行 命令 为 : 


/Users/IcyFenix/Develop/JVM/jdkBuild/openjdk 7u4/hotspot/build/bsd 
Queens 








上 面 的 Queens 是 Makefile 脚 本 自动 产生 的 一 段 解 八 星 后 问题 的 Java 
程序 ， 用 于 测试 虚拟 机 ， 这 里 笔者 直接 拿 来 用 了 ， 读 者 完全 可 以 将 它 蔡 
换 为 目 己 的 Java 程 序 。 





读者 在 调试 Java 代 码 执行 时 ， 如 果 要 跟踪 具体 Java 代 码 在 虚拟 机 中 
是 如 何 执 行 的 ， 也 许 会 觉得 无 从 下 手 ， 因 为 目前 在 HotSpot 主 流 的 操作 
系统 上 上， 部 采用 模板 解释 器 来 执行 字 市 码 ， 它 与 JIT 编 译 右 一 样 ， 最 终 
执行 的 汇编 代码 都 是 运行 期 间 产 生 的 ， 无 法 直接 设置 断 点 ， 所 以 
HotSpot 增 加 了 以 下 参数 来 方便 开 及 人 员 调 试 解释 需 。 





-XX:+TraceBytecodes-XX:StoplInterpreterAt=<n> 

















这 组 参数 的 作用 是 当 遇 到 序号 为 <n>> 的 字 节 码 指令 时 ， 便 会 中 断 
程序 执行 ， 进 入 断 点 调试 。 在 调试 解释 器 部 分 代码 时 ， 把 这 两 个 参数 加 
到 gamma 后 面 即 可 。 





最 后 ， 还 需要 在 “环境 ”窗口 中 设置 环境 变量 ， 也 就 是 前 面 env.sh 脚 
本 所 设置 的 那 几 个 环境 变量 ， 如 图 1-10 所 示 。 


项 目 属 性 ~ hotspot 











配置 :| Default (活动 ) :| | 管理 配置 (M),.， | 








/Users /IcyFenix/Develop/JVM/jdkBui... 
LD_LIBRARY_PATH=/Users /IcyFenix/... 





/Users /IcyFenix/Develop/JVM /jdk... 3 
国 


内 部 终 刻 


/JUsers /IcyFenix/Develop /JVM/jdkBuild/openjdk... 
JLibrary/Java JavaVirtualMachines/jdk1.7.0_04.... 
-SUAVA_HOME}/ire /lib/rt.jar: SUAVA_HOME}/Ir... 











图 1-10 在 NetBeans 中 创建 HotSpot 项 目 (3) 


完成 以 上 配置 之 后 ， 一 个 可 修改 、 编 译 、 调 试 的 HotSpot 工 程 就 完 
全 建立 起 来 了 ， 启 动 器 的 执行 入 口 是 java.c 的 main0 方 法 ， 读 者 可 以 设置 
断 点 单 步 跟 踪 ， 如 图 1-11 所 示 。 


WW hotspot ~- NetBeans IDE 7.2.1 
年 交配 -9g@ 人 由 全 会 上 


me 可 re rr pr 下 


[ER 四 图- 届 - 忆 号 罗网 | 个 多 ie 


| * Entry poin 


| int 
| mainiiint argc, char ** argv) 
lt 


其 


char *classname = 8; 

char *s = 0; 

Char *main_class = NULL; 

int ret; 

Invocat ionFunctions ifn; 

jlong start, end; 

char jrepath [MAXPATHLEN]，jvmpath (MAXPATHLEN]; 
char ** original_argv = i 


if (getenv(™ JAVA_LAUNCHER_ DEBYG") != 0@) { 
_launcher_debug = NI TRUE; 
printf("————_ JAVA_LAUNCHER_DEBUG———\n"); 


main(int argc, char' argv) - 导 角 器 全 
VME NO 





图 1-11 在 NetBeans 中 创建 HotSpot 项 目 (4) 


由 于 HotSpot 的 源码 比较 长 ，C/C++ 文 件数 量 也 很 多 ， 为 了 便于 读者 
阅读 ， 所 以 代码 清单 1-3 给 出 了 各 个 目录 中 代码 的 主要 用 途 ， 供 读者 参 
考 。 


代码 清单 1-3 ”HotSpot 源 码 结构 品 


hotspot 


上 一 agent Serviceability Agent 的 实现 

上 一 make 用 来 build 出 HotSpot 的 各 种 配置 文件 
上 一 src HotSpot VM 的 源 代码 

| Fepu CPU 相关 代码 

| Fs 操作 系 相关 代码 

| 上 一 os_cpu 操作 系统 +CPU 组 合 的 相关 代码 

| L— share 平台 无 关 的 共通 代码 

| Fto0ls 工具 

| | HH—hsdis 反 汇 编 插件 

| | 上 一 IdealGraphVisualizer 将 Server 编译 器 的 中 间 代 码 可 视 化 的 工具 
| | |H— launcher 启动 程序 "java" 

| | 


上 一 LogCompilation 将 -XX:+LogCompilation 输出 的 日 志 (hotspot .1og) 


上 一 test 


上 -一 ProjectCreator 


上 一 classfile 

一 -一 code 

上 + 一 compiler 

一 一 gc_implementation 

| | concurrentMarkSweep 


|。 必 一 二 
| HF parallelScavenge 


| HF parNew 

| LL shared 
一 一 gc_interface 
上 一 interpreter 


HF— 1libadt 
上 一 memory 
-一 oops 
+- 一 opto 

上 一 prims 


一 一 runtime 


上 一 services 


一 一 shark 


上 一 utilities 


整理 成 更 容易 阅读 的 格式 的 工具 
生成 Visual Studio 的 project 文件 的 工具 


HotSpot VM 的 核心 代码 


平台 描述 文件 (上面 的 cpu 或 os_cpu 里 的 *.ad 
文件 ) 的 编译 器 
汇编 器 接口 
Client 编译 器 
动态 编译 器 的 公共 服务 / 接口 
类 文件 的 处 理 〔 包 括 类 加 载 和 系统 符号 表 等 ) 
动态 生成 的 代码 的 管理 
编译 器 接口 
GC 的 实现 
Concurrent Mark Sweep GC 的 实现 
Garbage-First GC 的 实现 (不 使 用 老 的 分 代 
式 GC 框架 ) 
ParallelScavenge GC 的 实现 (Server VM 
默认 ,不 使 用 老 的 分 代 式 GC 框架 ) 
ParNew GC 的 实现 
GC 的 共通 实现 
GC 的 接口 
解释 器 ， 和 包括" 模板 解释 器 "(官方 版 在 用 》 和 
"C++ 解释 器 " (官方 版 不 再 用 ) 
一 些 抽象 数据 结构 
内 存 管 理 相关 〔( 老 的 分 代 式 GC 框架 也 在 这 里 ) 
HotSpot VM 的 对 象 系统 的 实现 
Server 编译 器 
HotSpot VM 的 对 外 接口 ， 包 括 部 分 标准 库 的 
native 部 分 和 JVMTI 实现 
运行 时 支持 库 〈 包 括 线程 管理 、 编 译 器 调度 、 锁 、 
反射 等 ) 
主要 是 用 来 支持 JMX 之 类 的 管理 功能 的 接口 
基于 LLVM 的 JIT 编译 器 (官方 版 里 没有 使 用 ) 
一 些 基 本 的 工具 类 


单元 测试 


[1 该 目录 结构 由 RednaxelaFX 整 理 : 


http:/ /hllvm.group.iteye.com/ group/topic/26998。 


1.7 本 章 小 结 





本 章 介 绍 了 Java 技 术 体 系 的 过 去 、 现 在 以 及 未 来 的 一 些 发 展 趋势 ， 
通过 实战 介绍 了 如 何 自 己 来 独立 编译 一 个 OpenJDK 7。 作 为 全 书 的 引 
言 部 分 ， 本 章 建 立 了 后 文 研 究 所 必需 的 环境 。 在 了 解 Java 技 术 的 来 龙 去 
脉 后 ， 后 面 章 节 将 分 为 4 部 分 去 介绍 Java 在 内 存 管 理 、Class 文 件 结构 与 
执行 引擎 、 编 译 器 优化 及 多 线程 并 发 方面 的 实现 原理 。 


六 











第 二 部 分 “ 目 动 内 存 管理 机 制 
Java 内 存 区 域 与 内 存 溢出 异常 
垃圾 收集 器 与 内 存 分 配 策略 
虚拟 机 性 能 监控 与 故障 处 理工 具 


调 优 和 案例 分 析 与 实战 


第 2 章 Java 内 存 区 域 与 内 存 洲 出 异 曲 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 “高 
墙 "， 墙 外 面 的 人 想 进 去 ， 增 里 面 的 人 却 想 出 来 。 


2.1 概述 


对 于 从 事 C、C++ 程 序 开发 的 开 及 人 员 来 次 ， 在 内 存 管 理 领域 ， 他 
们 既是 拥有 最 高 权力 的 “ 星 带 ”又 是 从 事 最 基础 工作 的 “区 动人 民 一 一 既 
拥有 每 一 个 对 象 的 “所 有 权 ”， 又 担负 着 每 一 个 对 象 生 命 开 始 到 终结 的 维 
"Es 





对 于 Java 程 序 员 来 说 ， 在 虚拟 机 上 自动 内 存 管理 机 制 的 帮助 下 ， 不 再 
需要 为 每 一 个 new 操作 去 写 配 对 的 delete/free 代 码 ， 不 容易 出 现 内 存 泄漏 
和 内 存 溢出 问题 ， 由 虚拟 机 管理 内 存 这 一 切 看 起 来 都 很 美好 。 不 过 ， 也 
正 古 因为 Java 程 友 员 把 内 存 控制 的 权力 交 给 了 Java 虚 拟 机 ， 一 旦 出 现 内 
存 泄漏 和 洲 出 方面 的 问题 ， 如 果 不 了 解 虚拟 机 是 怎样 使 用 内 存 的 ， 那 么 
排查 错误 将 会 成 为 一 项 异常 艰难 的 工作 。 











本 章 是 第 二 部 分 的 第 1 草 ， 笔 者 将 从 概念 上 介绍 Java 虚 拟 机 内 存 的 
各 个 区 域 ， 讲 解 这 些 区 域 的 作用 、 服 务 对 象 以 及 其 中 可 能 产生 的 问题 ， 
这 是 翻越 虚拟 机 内 存 管理 这 墙 围 墙 的 第 一 步 。 


2.2 ”运行 时 数据 区 域 


Java 虚 拟 机 在 执行 Java 程 序 的 过 程 中 会 把 它 所 管理 的 内 存 划分 为 行 
干 个 不 同 的 数据 区 域 。 这 些 区 域 都 有 各 目的 用 途 ， 以 及 创建 和 销毁 的 时 
间 ， 有 的 区 域 随 着 虚拟 机 进程 的 局 动 而 存在 ， 有 些 区 域 则 依赖 用 户 线 程 
的 局 动 和 结束 而 建立 和 销毁 。 根 据 《Java 虚 拟 机 规范 (Java SE 7 版 ) 》 
的 规定 ，Java 虚 拟 机 所 管理 的 和 内存 将 会 包括 以 下 几 个 运行 时 数据 区 域 ， 
如 图 2-1 所 示 。 





方法 区 虚拟 本 地 方法 村 
Natiwve Method 
Method Ares VW Sta Sitack 
堆 程序 计数 器 
Heap Proaram Counter Reeister 


执行 引擎 。” ” 轩 、 本 地 库 接口 并 + 地 放 太 库 


| | 由 所 有 北 程 共享 的 数据 区 
| “| 战 程 隔离 的 数据 区 





图 2-1 Java 虚拟 机 运行 时 数据 区 


2.2.1 程序 计数 器 


程序 计数 器 (Program Counter Register) 是 一 块 较 小 的 内 存 空间 ， 
它 可 以 看 作 是 当前 线程 所 执行 的 字 市 码 的 行 号 指示 器 。 在 虚拟 机 的 概念 
模型 里 〈 仪 是 概念 模型 ， 各 种 虚拟 机 可 能 会 通过 一 些 更 高 效 的 方式 去 实 
现 ) ， 字 节 码 解释 堪 工 作 时 就 是 通过 改变 这 个 计数 圳 的 值 来 选取 下 一 条 
需要 执行 的 字 节 码 指令 ,分 支 、 和 人 循环 、 跳 转 、 寞 第 处 理 、 线 程 恢复 等 基 
础 功能 都 再 要 依赖 这 个 计数 需 来 完成 。 





由 于 Java 虚 拟 机 的 多 线程 是 通过 线程 轮流 切换 并 分 配 处 理 融 执行 时 
间 的 方式 来 实现 的 ， 在 任何 一 个 确定 的 时 刻 ， 一 个 处 理 器 (对 于 多 核 处 
理 咒 来 说 是 一 个 内 核 ) 都 只 会 执行 一 条 线程 中 的 指令 。 因 此 ， 为 了 线程 
切换 后 能 恢复 到 正确 的 执行 位 置 ， 每 条 线程 都 需要 有 一 个 独立 的 程序 计 
数 句 ， 各 条 线程 之 间 计 数 器 互 不 影响 ， 独 立 存储 ， 我 们 称 这 类 内 存 区 域 
为 “线程 私有 ”的 内 存 。 





如 果 线 程 正在 执行 的 是 一 个 Java 方 法 ， 这 个 计数 器 记录 的 是 正在 执 
行 的 虚拟 机 字 节 码 指 令 的 地 址 ， 如果 正在 执行 的 是 Native 方 法 ， 这 个 计 
数 器 值 则 为 空 (Undefined〉。 此 内 存 区 域 是 唯一 一 个 在 Java 虚 拟 机 规范 
中 没有 规定 任何 OutOfMemoryError 情 况 的 区 域 。 


2.2.2 ”Java 虚拟 机 栈 


与 程序 计数 器 一 样 ，Java 虚 拟 机 栈 〈Java Virtual Machine Stacks ) 
也 是 线程 私有 的 ， 它 的 生命 周期 与 线程 相同 。 虚 拟 机 栈 描述 的 是 Java 方 
法 执行 的 内 存 模型 : 每 个 方法 在 执行 的 同时 都 会 创建 一 个 栈 帧 〈Stack 
Framel11) 用 于 存储 局 部 变量 表 、 操 作 数 栈 、 动 态 链接 、 方 法 出 口 等 信 
恩 。 每 一 个 方法 从 调用 直至 执行 完成 的 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 
机 栈 中 入 栈 到 出 栈 的 过 程 。 








经 党 有 人 把 Java 内 存 区 分 为 堆 内 存 (Heap〉 和 栈 内 存 (Stack) ， 这 
种 分 法 比较 粗糙 ，Java 内 存 区 域 的 划分 实际 上 远 比 这 复杂 。 这 种 划分 方 
式 的 流行 只 能 说 明 大 多 数 程序 员 最 关注 的 、 与 对 象 内 存 分 配 关 系 最 密切 
的 内 存 区 域 是 这 两 块 。 其 中 所 指 的 “ 堆 ” 笔 者 在 后 面 会 专门 讲述 ， 而 所 指 
的 “ 栈 ” 束 是 现在 讲 的 虚拟 机 栈 ， 或 者 说 是 虚拟 机 栈 中 局 部 变量 表 部 分 。 











局 部 变量 表 存放 了 编译 期 可 知 的 各 种 基本 数据 类 型 (boolean、 
byte、char、short、int、float、long、double〉、 对 象 引用 (reference 类 
型 ， 它 不 等 同 于 对 象 本 身 ， 可 能 是 一 个 指向 对 象 起 始 地 址 的 引用 指针 ， 
也 可 能 是 指向 一 个 代表 对 象 的 句柄 或 其 他 与 此 对 象 相 关 的 位 置 》 和 


returnAddress 类 型 〈 指 癌 了 一 条 字 节 码 指令 的 地 址 ) 。 





其 中 64 位 长 度 的 long 和 double 类 型 的 数据 会 占用 2 个 局 部 变量 空间 








《Slot) ， 其 余 的 数据 类 型 只 占用 1 个 。 局 部 变量 表 所 需 的 内 存 空间 在 编 
译 期 间 完 成 分 配 ， 当 进入 一 个 方法 时 ， 这 个 方法 需要 在 帧 中 分 配 多 大 的 
局 部 变量 空间 是 完全 确定 的 ， 在 方法 运行 期 间 不 会 改变 局 部 变量 表 的 大 




















小 。 





在 Java 虚 拟 机 规范 中 ， 对 这 个 区 域 规定 了 两 种 寞 第 状况 : 如 果 线 程 
请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 深度 ， 将 抛 出 StackOverflowError 异 
常 ， 如 果 虚 拟 机 栈 可 以 动态 扩展 (当前 大 部 分 的 Java 虚 拟 机 都 可 动态 扩 
展 ， 只 不 过 Java 虚 拟 机 规范 中 也 人 允许 固定 长 度 的 虚拟 机 栈 ) ， 如 果 扩 展 
时 无 法 申请 到 足够 的 内 存 ， 束 会 执 出 OutOfMemoryError 寞 第 。 





[1 ] 栈 帧 是 方法 运行 时 的 基础 数据 2 吉 构 ， 在 本 书 的 第 8 章 中 会 对 帧 进行 详 
细 讲 解 。 


2.2.3 ”本 地 方法 栈 


本 地 方法 栈 (Native Method Stack) 与 虚拟 机 栈 所 发 挥 的 作用 是 非 
常 相似 的 ， 它 们 之 间 的 区 别 不 过 是 虚拟 机 栈 为 虚拟 机 执行 Java 方 法 (也 
就 是 字 节 码 ) 服务 ， 而 本 地 方法 栈 则 为 虚拟 机 使 用 到 的 Native 方 法 服 
务 。 在 虚拟 机 规范 中 对 本 地 方法 栈 中 方法 使 用 的 语言 、 使 用 方式 与 数据 
结构 并 没有 强制 规定 ， 因 此 具体 的 虚拟 机 可 以 自由 实现 它 。 甚 至 有 的 虚 
拟 机 《譬如 Sun HotSpot 虚 拟 机 )》 直接 就 把 本 地 方法 栈 和 虚拟 机 栈 合 二 为 
一 。 与 虚拟 机 栈 一 样 ， 本 地 方法 栈 区 域 也 会 抛 出 StackOverflowError 和 


OutOfMemoryError 异 常 。 








2.2.4 _ Java 推 





对 于 大 多 数 应 用 来 说 ，Java 堆 (Java Heap) 是 Java 虚 拟 机 所 管理 的 
内 存 中 最 大 的 一 块 。Java 扒 是 和 被 所 有 线程 共享 的 一 块 内 存 区 域 ， 在 虚拟 
机 局 动 时 创建 。 此 内 存 区 域 的 唯一 目的 就 是 存放 对 象 实例 ， 几 乎 所 有 的 
对 象 实例 都 在 这 里 分 配 内 存 。 这 一 点 在 Java 虚 拟 机 规范 中 的 描述 是 : 所 
有 的 对 象 实例 以 及 数组 都 要 在 堆 上 分 配 川 ， 但 是 随 着 JIT 编 译 器 的 发 展 
与 逃逸 分 析 技 术 逐 渐 成 熟 ， 栈 上 分 配 、 标 量 蔡 换 己 优化 技术 将 会 导致 一 
些微 妙 的 变化 发 生 ， 所 有 的 对 象 都 分 配 在 堆 上 也 渐渐 变 得 不 是 那么 “ 绝 
对 ”了 。 








Java 堆 是 垃圾 收集 器 管理 的 主要 区 域 ， 因 此 很 多 时 候 也 被 称 做 “GC 
堆 ”(Garbage Collected Heap， 和 邓 好 国内 没 翻译 成 "垃圾 堆 >) 。 从 内 存 回 
收 的 角度 来 看 ， 由 于 现在 收集 器 基本 都 采用 分 代 收 集 算 法 ， 所 以 Java 堆 
中 还 可 以 细 分 为 : 新 生 代 和 老年 代 ; 再 细致 一 点 的 有 Eden 空 间 、From 
Survivor 空 间 、To Survivor 空 间 等 。 从 内 存 分 配 的 角度 来 看 ， 线 程 共享 
的 Java 堆 中 可 能 划分 出 多 个 线程 私有 的 分 配 缓冲 区 (Thread Local 
Allocation Buffer,TLAB)〉 。 不 过 无 论 如 何 划分 ， 都 与 存放 内 容 无 关 ， 无 
论 哪个 区 域 ， 存 储 的 都 仍然 是 对 象 实例 ， 进 一 步 划分 的 目的 是 为 了 更 好 
地 回收 内 存 ， 或 者 更 快 地 分 配 内 存 。 在 本 章 中 ， 我 们 仅仅 针对 内 存 区 域 
的 作用 进行 讨论 ，Java 扒 中 的 上 述 各 个 区 域 的 分 配 、 回 收 等 细节 将 是 第 

















3 章 的 主题 。 


根据 Java 虚 拟 机 规范 的 规定 ，Java 堆 可 以 处 于 物理 上 不 连续 的 内 存 
空间 中 ， 只 要 逻辑 上 是 连续 的 即 可 ， 就 像 我 们 的 磁盘 空间 一 样 。 在 实现 
时 ， 既 可 以 实现 成 固定 大 小 的 ， 也 可 以 是 可 扩展 的 ， 不 过 当前 主流 的 虚 
拟 机 都 是 按照 可 扩展 来 实现 的 〈 通 过 -Xmx 和 -Xms 控 制 ) 。 如 果 在 堆 中 
没有 内 存 完 成 实例 分 配 ， 并 且 堆 也 无 法 再 扩展 时 ， 将 会 抛 出 


OutOfMemoryError 异 常 。 








[1Java 虚 拟 机 规范 中 的 原文 : The heap is the runtime data atea from which 
memory fot all class instances and attays is allocated。 


站] 逃 选 分 析 与 标量 替换 的 相关 内 容 ， 参 见 第 11 章 相关 内 容 。 


2 思 合 区 


方法 区 (Method Area) 与 Java 扒 一 样 ， 是 各 个 线程 共享 的 内 存 区 
域 ， 它 用 于 存储 已 被 虚拟 机 加 载 的 类 信息 、 常 量 、 静 态 变 量 、 即 时 编译 
虱 编 译 后 的 代码 等 数据 。 虽 然 Java 虚 拟 机 规范 把 方法 区 描述 为 堆 的 一 个 
逻辑 部 分 ， 但 是 它 却 有 一 个 别名 叫做 Non-Heap〈 非 堆 ) ， 目 的 应 该 是 与 
Java 堆 区 分 开 来 。 








对 于 习惯 在 HotSpot 虚 拟 机 上 开发 、 部 署 程序 的 开发 者 来 说 ， 很 多 
人 都 更 愿意 把 方法 区 称 为 永久 代 ”(Permanent Generation) ， 本 质 上 两 
者 并 不 等 价 ， 仅 仅 是 因为 HotSpot 虚 拟 机 的 设计 团队 选择 把 GC 分 代 收 集 
扩展 至 方法 区 ， 或 者 说 使 用 永久 代 来 实现 方法 区 而 已 ， 这 样 HotSpot 的 
垃圾 收集 器 可 以 像 管理 Java 扒 一样 管理 这 部 分 内 存 ， 能 够 省 去 专门 为 方 
法 区 编写 内 存 管理 代码 的 工作 。 对 于 其 他 虚拟 机 (如 BEA JRockit、IBM 
J9 等 ) 来 说 是 不 存在 永久 代 的 概念 的 。 原 则 上 ， 如 何 实现 方法 区 属于 虚 
拟 机 实现 细节 ， 不 受 虚 拟 机 规范 约束 ， 但 使 用 永久 代 来 实现 方法 区 ， 现 
在 看 来 并 不 是 一 个 好 主意 ， 因 为 这 样 更 容易 遇 到 内 存 溢出 问题 (永久 代 
有 -XX:MaxPermSize 的 上 限 ，J9 和 JRockit 只 要 没有 触 磁 到 进程 可 用 内 存 
的 上 限 ， 例 如 32 位 系统 中 的 4GB， 就 不 会 出 现 问题 ， 而 且 有 极 少数 方 
法 《例如 String.internO ) 会 因 这 个 原因 导致 不 同 虚 拟 机 下 有 不 同 的 表 
现 。 因 此 ， 对 于 HotSpot 虚 拟 机 ， 根 据 官方 发 布 的 路 线 图 信息 ， 现 在 也 














有 放弃 永久 代 并 逐步 改 为 采用 Native Memory 来 实现 方法 区 的 规划 了 
1， 在 目前 已 经 发 布 的 JDK 1.7 的 HotSpot 中 ， 已 经 把 原本 放 在 永久 代 的 


字符 串 常量 池 移 出 。 


Java 虚 拟 机 规范 对 方法 区 的 限制 非 党 宽松， 除了 和 Java 扒 一样 不 需 
要 连续 的 内 存 和 可 以 选择 固定 大 小 或 者 可 扩展 外 ， 还 可 以 选择 不 实现 二 
圾 收集 。 相 对 而 言 ， 垃 圾 收集 行为 在 这 个 区 域 是 比较 少 出 现 的， 但 并 非 
数据 进入 了 方法 区 束 如 永久 代 的 名 字 一 样 “永久 ”存在 了 。 这 区 域 的 内 存 
回收 目标 主要 是 针对 常量 池 的 回收 和 对 类 型 的 卸载 ， 一 般 来 说 ， 这 个 区 
域 的 回收 < 成绩” 比较 难以 令 人 满意 ， 尤 其 是 类 型 的 凶 载 ， 条 件 相 当 苛 
刻 ， 但 是 这 部 分 区 域 的 回收 确实 是 必要 的 。 在 Sun 公 司 的 BUG 列表 中 ， 
曾 出 现 过 的 知 干 个 严重 的 BUG 就 是 由 于 低 厂 本 的 HotSpot 虚 拟 机 对 此 区 
域 未 完全 回收 而 导致 内 存 泄漏 。 





根据 Java 虚 拟 机 规范 的 规定 ， 当 方法 区 无 法 满足 内 存 分 配 需求 时 ， 


将 抛 出 OutOfMemoryError 异 常 。 


[JEP 122-Remove the Petmanent Cenetation : 


http:/ /openjdk.java.net/jeps/122。 





2.2.6 ”运行 时 第 量 池 


运行 时 常量 池 (Runtime Constant Pool) 是 方法 区 的 一 部 分 。Class 
文件 中 除了 有 类 的 版 本 、 字 段 、 方 法 、 接 口 等 描述 信息 外 ， 还 有 一 项 信 
恩 是 常量 池 (Constant Pool Table) ， 用 于 存放 编译 期 生成 的 各 种 字面 量 
和 符号 引用 ， 这 部 分 内 容 将 在 类 加 载 后 进入 方法 区 的 运行 时 第 量 池 中 存 
放 。 





Java 虚 拟 机 对 Class 文 件 每 一 部 分 “自然 也 包括 常量 池 ) 的 格式 都 有 
严格 规定 ， 每 一 个 字 节 用 于 存储 哪 种 数据 都 必须 符合 规范 上 的 要 求 才 会 
被 虚拟 机 认可 、 装 载 和 执行 ， 但 对 于 运行 时 常量 地 ，Java 虚 拟 机 规范 没 
有 做 任何 细 市 的 要 求 ， 不 同 的 提供 商 实 现 的 虚拟 机 可 以 按照 自己 的 需要 
来 实现 这 个 内 存 区 域 。 不 过 ， 一 般 来 说 ， 除 了 保存 Class 文 件 中 摘 述 的 符 
号 引用 外 ， 还 会 把 翻译 出 来 的 直接 引用 也 存储 在 运行 时 常量 池 中 1。 








运行 时 常量 池 相 对 于 Class 文 件 常量 池 的 另外 一 个 重要 特征 是 具备 动 
态 性 ，Java 语 言 并 不 要 求 冲 量 一 定 只 有 编译 期 才能 产生 ， 也 就 是 并 非 预 
置 入 Class 文 件 中 常量 池 的 内 容 才 能 进入 方法 区 运行 时 常量 池 ， 运 行 期 间 
也 可 能 将 新 的 常量 放 入 池 中 ， 这 种 特性 补 开 发 人 员 利 用 得 比较 多 的 便 是 
String 类 的 intern() 方 法 。 











既然 运行 时 常量 池 古 方法 区 的 一 部 分 ， 目 然 受 到 方法 区 内 存 的 限 


制 ， 当 常量 
量 池 无 法 再 
中 
请 到 内 存 时 会 抛 出 O 
utOf Memor 
yError 异 常 。 


[1] 关 于 C 
lass 文 件 格 式 和 符号 
号 引用 等 相 
玩 仿 可 
见 第 6 章 。 


2.2.7 直接 内 存 


直接 内 存 (Direct Memory) 并 不 是 虚拟 机 运行 时 数据 区 的 一 部 分 ， 
也 不 是 Java 虚 拟 机 规范 中 定义 的 内 存 区 域 。 但 是 这 部 分 内 存 也 被 频繁 地 
使 用 ， 而 且 也 可 能 导致 OutOfMemoryError 异 常 出 现 ， 所 以 我 们 放 到 这 里 
一 起 讲解 。 





在 JDK 1.4 中 新 加 入 了 NIO (New InputyOutput) 类 ， 引 入 了 一 种 基 
于 通道 《Channel) 与 缓冲 区 (Buffer) 的 IO 方式 ， 它 可 以 使 用 Native 函 
数 库 直 接 分 配 堆 外 内 存 ， 然 后 通过 一 个 存储 在 Java 堆 中 的 
DirectByteBuffer 对 象 作为 这 块 内 存 的 引用 进行 操作 。 这 样 能 在 一 些 场景 
中 显著 提高 性 能 ， 因 为 避免 了 在 Java 堆 和 Native 堆 中 来 回复 制 数 据 。 





显然 ， 本 机 直接 内 存 的 分 配 不 会 受到 Java 扒 大 小 的 限制 ， 但 是 ， 既 
然 是 内 存 ， 肯 定 还 是 会 受到 本 机 总 内 存 〈 包 括 RAM 以 及 SWAP 区 或 者 分 
页 文件 ) 大 小 以 及 处 理 器 寻 址 空间 的 限制 。 服 务 器 管理 员 在 配置 虚拟 机 
参数 时 ， 会 根据 实际 内 存 设 置 -Xmx 等 参数 信息 ， 但 经 常 忽略 直接 内 
存 ， 使 得 各 个 内 存 区 域 总 和 大 于 物理 内 存 限 制 〈 包 括 物 理 的 和 操作 系统 
级 的 限制 ) ， 从 而 导致 动态 扩展 时 出 现 OutOfMemoryError 异 常 。 











2.3 ”HotSpot 虚 拟 机 对 象 探 秘 


介绍 完 Java 虚 拟 机 的 运行 时 数据 区 之 后 ， 我 们 大 致知 道 了 虚拟 机 内 
存 的 概况 ， 读 者 了 解 了 内 存 中 放 了 些 什么 后 ， 也 许 就 会 想 更 进一步 了 解 
这 些 虚 拟 机 内 存 中 的 数据 的 其 他 细节 ， 壁 如 它们 是 如 何 创建 、 如 何 布 局 
以 及 如 何 访 间 的 。 对 于 这 样 涉 及 细 市 的 问题 ， 必 须 把 讨论 范围 限定 在 具 
体 的 虚拟 机 和 集中 在 某 一 个 内 存 区 域 上 才 有 意义 。 基 于 实用 优先 的 原 
则 ， 笔 者 以 常用 的 虚拟 机 HotSpot 和 和 锅 用 的 内 存 区 域 Java 扒 为 例 ， 深 入 探 
讨 HotSpot 虚 拟 机 在 Java 扒 中 对 象 分 配 、 布 局 和 访问 的 全 过 程 。 


2.3.1 对 象 的 创建 





Java 是 一 门面 问 对 象 的 编程 语言 ， 在 Java 程 序 运 行 过 程 中 无 时 无 刻 
都 有 对 象 被 创建 出 来 。 在 语言 层面 上 ， 创 建 对 象 ( 例 如 克隆 、 反 序列 
化 ) 通常 仅仅 是 一 个 new 关键 字 而 已 ， 而 在 虚拟 机 中 ， 对 象 ( 文 中 讨论 
的 对 象限 于 普通 Java 对 象 ， 不 包括 数组 和 Class 对 象 等 ) 的 创建 又 是 怎样 


一 个 过 程 呢 ? 








虚拟 机 遇 到 一 条 new 指 令 时 ， 首 移 将 去 检查 这 个 指令 的 参数 是 人 否 能 
在 常量 池 中 定位 到 一 个 类 的 符号 引用 ， 并 且 检 查 这 个 符号 引用 代表 的 类 
是 否 已 被 加 载 、 解 析 和 初始 化 过 。 如 果 没 有 ， 那 必须 先 执行 相应 的 类 加 





载 过 程 ， 本 书 第 7 章 将 探讨 这 部 分 内 容 的 细节 。 


在 类 加 载 检查 通过 后 ， 接 下 来 虚拟 机 将 为 新 生 对 象 分 配 内 存 。 对 象 
所 需 内 存 的 大 小 在 类 加 载 完 成 后 便 可 完全 确定 (如 何 确定 将 在 2.3.2 节 中 
介绍 ) ， 为 对 象 分 配 空间 的 任务 等 同 于 把 一 块 确定 大 小 的 内 存 从 Java 推 
中 划分 出 来 。 假 设 Java 推 中 内 存 是 绝对 规整 的 ， 所 有 用 过 的 内 存 都 放 在 
一 边 ， 空 闲 的 内 存放 在 另 一 边 ， 中 间 放 着 一 个 指针 作为 分 界 点 的 指示 
器 ， 那 所 分 配 内 存 就 仅仅 是 把 那个 指针 铅 空 闲 空间 那 边 挪动 一 段 与 对 象 
大 小 相等 的 距离 ， 这 种 分 配方 式 称 为 “指针 磁 撞 ”(Bump the Pointer) 。 
如 果 Java 推 中 的 内 存 并 不 是 规整 的 ， 已 使 用 的 内 存 和 空闲 的 内 存 相 互 交 
错 ， 那 就 没有 办 法 简单 地 进行 指针 碰撞 了 ， 虚 拟 机 就 必须 维护 一 个 列 
表 ， 记 录 上 哪些 内 存 块 是 可 用 的 ， 在 分 配 的 时 候 从 列表 中 找到 一 块 足够 
大 的 空间 划分 给 对 象 实例 ， 并 更 新 列表 上 的 记录 ， 这 种 分 配方 式 称 
为 “空闲 列表 ”(Free List) 。 选 择 哪 种 分 配方 式 由 Java 堆 是 否 规 整 决 
定 ， 而 Java 扒 是 否 规整 又 由 所 采用 的 垃圾 收集 器 是 否 带 有 压缩 整理 功能 
决定 。 因 此 ， 在 使 用 Serial、ParNew 等 带 Compact 过 程 的 收集 器 时 ， 系 统 
采用 的 分 配 算法 是 指针 人 碰撞， 而 使 用 CMS 这 种 基于 Mark-Sweep 算 法 的 
收集 器 时 ， 通 常 采 用 空闲 列表 。 





除 如 何 划分 可 用 空间 之 外 ， 还 有 另外 一 个 需要 考 夸 的 问题 是 对 象 创 
建 在 虚拟 机 中 是 非常 频 莹 的 行为 ， 即 使 是 仅仅 修改 一 个 指针 所 指 辣 的 位 
置 ， 在 并 发 情况 下 也 并 不 是 线程 安全 的 ， 可 能 出 现 正在 给 对 象 A 分 配 内 


存 ， 指 针 还 没 来 得 及 修改 ， 对 象 B 又 同时 使 用 了 原来 的 指针 来 分 配 内 存 
的 情况 。 解 决 这 个 问题 有 两 种 方案 ， 一 种 是 对 分 配 内 存 空 间 的 动作 进行 
同步 处 理 一 一 实际 上 虚拟 机 采用 CAS 配 上 失败 重 试 的 方式 保证 更 新 操作 
的 原子 性 ;， 另 一 种 是 把 内 存 分 配 的 动作 按照 线程 划分 在 不 同 的 空间 之 中 
进行 ， 即 每 个 线程 在 Java 堆 中 预先 分 配 一 小 块 内 存 ， 称 为 本 地 线程 分 配 
缓冲 〈Thread Local Allocation Buffer,TLAB) 。 哪 个 线程 要 分 配 内 存 ， 

就 在 哪个 线程 的 TLAB 上 分 配 ， 只 有 TLAB 用 完 并 分 配 新 的 TLAB 时 ， 才 
需要 同步 锁定 。 虚 拟 机 是 否 使 用 TLAB， 可 以 通过 -XX:+/-UseTLAB 参 数 


来 设 定 。 

















内 存 分 配 完成 后 ， 虚 拟 机 需要 将 分 配 到 的 内 存 空间 都 初始 化 为 零 值 
(不 包括 对 象 头 ) ， 如 果 使 用 TLAB， 这 一 工作 过 程 也 可 以 提前 至 
TLAB 分 配 时 进行 。 这 一 步 操作 保证 了 对 象 的 实例 字段 在 Java 代 码 中 可 
以 不 赋 初 始 值 就 直接 使 用 ， 程 序 能 访问 到 这 些 字 段 的 数据 类 型 所 对 应 的 
零 值 。 


接 下 来 ， 虚 拟 机 要 对 对 象 进 行 必要 的 设置 ， 例 如 这 个 对 象 是 哪个 类 
的 实例 、 如 何 才能 找到 类 的 元 数据 信息 、 对 象 的 哈 希 码 、 对 象 的 GC 分 
代 年 龄 等 信息 。 这 些 信息 存放 在 对 象 的 对 象 涉 Object Header) 之 中 。 
根据 虚拟 机 当前 的 运行 状态 的 不 同 ， 如 是 否 局 用 偏向 锁 等 ， 对 象 尖 会 有 
不 同 的 设置 方式 。 关 于 对 象 尖 的 具体 内 容 ， 稍 后 再 做 详细 介绍 。 











在 上 面 工 作 都 完成 之 后 ， 从 虚拟 机 的 视角 来 看 ， 一 个 新 的 对 象 已 经 


产生 了 ， 但 从 Java 程 序 的 视角 来 看 ， 对 象 创建 才刚 刚 开始 
法 还 没有 执行 ， 所 有 的 字段 都 还 为 零 。 所 以 ， 一 般 来 说 (由 字 市 码 中 是 
人 否 跟 随 invokespecial 指 令 所 决定 ) ， 执 行 hew 指 令 之 后 会 接着 执行 <init 
> 方法 ， 把 对 象 按照 程序 员 的 意愿 进行 初始 化 ， 这 样 一 个 真正 可 用 的 对 
象 才 算 完全 产生 出 来 。 








下 面 的 代码 清单 2-1 是 HotSpot 虚 拟 机 bytecodeInterpreter.cpp 中 的 代码 
片段 〈 这 个 解释 器 实现 很 少 有 机 会 实际 使 用 ， 因 为 大 部 分 平台 上 都 使 用 
模板 解释 器 ， 当 代码 通过 JIT 编 译 器 执行 时 差异 就 更 大 了 。 不 过 ， 这 段 
代码 用 于 了 解 HotSpot 的 运作 过 程 是 没有 什么 问题 的 ) 。 





代码 清单 2-1 HotSpot 解 释 器 的 代码 片段 








/ /确保 常量 池 中 存放 的 是 已 解释 的 类 
if (lconstants->tag at (index) .is unresolved klass()) { 
// 断 言 确保 是 kxlassoop 和 instanceKlassoop (这 部 分 下 一 节 介绍 ) 
oop entry= (klassOop) *constants->obj at addr (index):; 
assert (entry->is klass(), "Should be resolved klass"); 
klassOop k entry= (klassOop) entry; 
assert (k entry->klass part()->oop is instance(), "Should be 
instanceKlass") ; 
instanceKlass * ik= (instanceKlass*) k entry->klass part(); 
/ /确保 对 象 所 属 类 型 已 经 经 过 初始 化 阶段 
if (ik->is initialized() &&ik->can be fastpath allocated()) 
{ 
// 取 对 象 长 度 
size t obj size=ik->size helper (); 
oop result= NULL 
/ /记录 是 否 ;需要 将 对 象 所 有 字段 置 零 什 
bool need zero=!2eroTLAB; 
/ /是否 在 TLAB 中 分 配对 象 
if (UseTLAB) { 
result= (oop) THREAD->tlab() .allocate (obj size) ; 
} 































































































if (result==NULL) { 
need zero=true; 





























// 直 接 在 eden 中 分 配对 象 

七 了 六 

HeapWord * compare to=*Universe:heap()-~>top aqqr () ; 

HeapWord * new top=compare to+ob]j size; 

/*cmpxchg 是 x86 中 的 CAS 指 令 ， 这 里 是 一 个 c++ 方 法， 通过 cAS 方 式 分 配 空间 ， 如 果 并 发 


失败 ， 
转 到 retry 中 重 试 ， 直 至 成 功 分 配 为 止 */ 
if (new top<=*Universe:heap()->end aqqr()) { 
if (Atomic:cmpxchg ptr (new top,Universe:heap()-~>top addr(), 
compare to) !=compare to) { 
goto retry; 
} 


result= (oop) compare to; 

















FE (result!=NULL) { 

/如 果 需 要 ， 则 为 对 象 初始 化 零 值 

FE (need zero) { 

eapWord * to zero= (HeapWord*) result+sizeof (oopDesc) /oopSizei; 
bj size-=sizeof (oopDesc) /oopSizei 

FE (obj size>0) | 

memset (to zero, 0, obj size * HeapWordqSize) : 


} 

















ho hh 一 一 











} 

/根据 是 全 合 启 用 偏 问 锁 来 设置 对 象 尖 信息 

F (UseBiasedLocking) 1 

result->set mark (ik->prototype header ()); 
}elsel{ 
result-~>set mark (markOopDesc:prototype () ) ; 
} 
result->set klass gap (0); 
result->set 3 (k entry); 
// 将 对 象 引用 入 栈 ， 继 续 执行 下 一 条 指令 
0 0 0); 

UPDATE PC AND TOS AND CONTINUE (3, 1); 
} 

} 

} 




























































































2.3.2 ”对 象 的 内 存 布局 








在 HotSpot 虚 拟 机 中 ， 对 象 在 内 存 中 存储 的 布局 可 以 分 为 3 块 区 域 : 
对 象 头 〈Header) 、 实 例 数据 (Instance Data) 和 对 齐 填 充 
(Padding) 。 


HotSpot 虚 拟 机 的 对 象 头 包 括 两 部 分 信息 ， 第 一 部 分 用 于 存储 对 象 
自身 的 运行 时 数据 ， 如 哈 希 码 (HashCode) 、GC 分 代 年 龄 、 锁 状态 标 
志 、 线 程 持 有 的 锁 、 偏 向 线程 ID、 偏 向 时 间 惟 等 ， 这 部 分 数据 的 长 度 在 
32 位 和 64 位 的 虚拟 机 《未 开启 压缩 指针 ) 中 分 别 为 32bit 和 64bit， 官 方 称 
它 为 "Mark Word"。 对 象 需要 存储 的 运行 时 数据 很 多 ， 其 实 已 经 超出 了 
32 位 、64 位 Bitmap 结 构 所 能 记录 的 限度 ， 但 是 对 象 头 信息 是 与 对 象 自 号 
定义 的 数据 无 关 的 额外 存储 成 本 ， 考 虑 到 虚拟 机 的 空间 效率 ，Mtark 
Word 被 设计 成 一 个 非 固定 的 数据 结构 以 便 在 极 小 的 空间 内 存储 尽量 多 
的 信息 ， 它 会 根据 对 象 的 状态 复 用 自己 的 存储 空间 。 例 如 ， 在 32 位 的 
HotSpot 虚 拟 机 中 ， 如 果 对 象 处 于 未 被 锁定 的 状态 下 ， 那 么 Mark Word 的 
32bit 空 间 中 的 25bit 用 于 存储 对 象 哈 硕 码 ，4bit 用 于 存储 对 象 分 代 年 龄 
2bit 用 于 存储 锁 标 志 位 ，1bit 回 定 为 0， 而 在 其 他 状态 《〈 轻 量 级 锁定 、 重 
量 级 锁定 、GC 标 记 、 可 偏向 ) 下 对 象 的 存储 内 容 见 表 2-1。 











表 2-1 HotSpot 虚拟 机 对 象 头 Mark Word 
存储 内 容 
对 象 哈 希 码 、 对 象 分 代 年 龄 
指向 锁 记 录 的 指 和 
指向 重量 级 锁 的 指针 
宇 ， 不 需要 记录 信息 
偏 问 线程 D、 偏 向 时 间 蕉 、 对 人 象 分 代 年 零 





未 锁定 

轻 量 级 锁定 

膨胀 (重量 级 锁定 ) 
GC 标记 

可 偏向 


























对 象 头 的 另外 一 部 分 是 类 型 指针 ， 即 对 象 指 向 它 的 类 元 数据 的 指 
针 ， 虚 拟 机 通过 这 个 指针 来 确定 这 个 对 象 是 哪个 类 的 实例 。 并 不 是 所 有 
的 虚拟 机 实现 都 必须 在 对 象 数据 上 保留 类 型 指针 ， 换 名 话说 ， 碍 找 对 象 
的 元 数据 信息 并 不 一 定 要 经 过 对 象 本 身 ， 这 点 将 在 2.3.3 节 讨论 。 另 外 ， 
如 果 对 象 是 一 个 Java 数 组 ， 那 在 对 象 尖 中 还 必须 有 一 块 用 于 记录 数组 长 
度 的 数据 ， 因 为 虚拟 机 可 以 通过 普通 Java 对 象 的 元 数据 信息 确定 Java 对 
象 的 大 小 ， 但 是 从 数组 的 元 数据 中 却 无 法 确定 数组 的 大 小 。 





代码 清单 2-2 为 HotSpot 虚 拟 机 markOop.cpp 中 的 代码 (注释) 片段 ， 
它 描 述 了 32bit 下 Mark Word 的 存储 状态 。 


代码 清单 2-2 markOop.cpp 片 段 























//Bit-format of an object header (most significant first,big 
endian layout below) : 











/32 Dit 

/了 二 过 二 过 二 二 到 二 

//hash:25----------—-— >|lage:4 biased lock:1 lock:2 (normal object) 

//JavaThread*:23 epoch:2 age:4 biased lock:1 lock:2 (biased 
object) 

/7 2 之 | (CMS free 
block) 

//PromotedObject*:29--------—-— >>|pronmo. bits:3a mS >| (CMS promoted 


object) 





接 下 来 的 实例 数据 部 分 是 对 象 真正 存储 的 有 效 信息 ， 也 是 在 程序 代 
码 中 所 定义 的 各 种 类 型 的 字段 内 容 。 无 论 是 从 父 类 继承 下 来 的 ， 还 是 在 
子 类 中 定义 的 ， 都 需要 记录 起 来 。 这 部 分 的 存储 顺序 会 受到 虚拟 机 分 配 
策略 参数 (FieldsAllocationStyle) 和 字段 在 Java 源 码 中 定义 顺序 的 影 
啊 。HotSpot 虚 拟 机 默认 的 分 配 策 略为 1ongs/doubles、ints、shorts/chars、 











bytes/booleans、oops (Ordinary Object Pointers) ， 从 分 配 策略 中 可 以 看 
出 ， 相 同 宽度 的 字段 总 是 被 分 配 到 一 起 。 在 满足 这 个 前 提 条 件 的 情况 
下 ， 在 父 类 中 定义 的 变量 会 出 现在 子 类 之 前 。 如 果 CompactFields 参 数值 
为 tue《〈 默 认为 true) ， 那 么 子 类 之 中 较 窗 的 变量 也 可 能 会 插入 到 父 类 变 
量 的 空隙 之 中 。 











第 三 部 分 对 齐 填 充 并 不 是 必然 存在 的 ， 也 没有 特别 的 含义 ， 它 仅仅 
起 着 占 位 符 的 作用 。 由 于 HotSpot VM 的 自动 内 存 管理 系统 要 求 对 象 起 始 
地 址 必须 是 8 字 贡 的 整数 倍 ， 换 句 话 说， 就 是 对 象 的 大 小 必须 是 8 字 节 的 
整数 倍 。 而 对 象 头 部 分 正好 古 8 字 节 的 倍数 〈1 倍 或 者 2 倍 ) ， 因 此 ， 当 
对 象 实例 数据 部 分 没有 对 齐 时 ， 就 需要 通过 对 齐 填 充 来 补 全 。 








2.3.3 对象 的 访问 定位 


建立 对 象 是 为 了 使 用 对 象 ， 我 们 的 Java 程 序 需 要 通过 栈 上 的 
reference 数 据 来 操作 堆 上 的 具体 对 象 。 由 于 reference 类 型 在 Java 虚 拟 机 
规范 中 只 规定 了 一 个 指向 对 象 的 引用 ， 并 没有 定义 这 个 引用 应 该 通过 何 
种 方式 去 定位 、 访 问 堆 中 的 对 象 的 具体 位 置 ， 所 以 对 象 访问 方式 也 是 取 
决 于 虚拟 机 实现 而 定 的 。 目 前 主流 的 访问 方式 有 使 用 句柄 和 直接 指针 两 
种 。 


如 果 使 用 句柄 访问 的 话 ， 那 么 Java 推 中 将 会 划分 出 一 块 内 存 来 作为 
句柄 池 ，reference 中 存储 的 就 是 对 象 的 句柄 地 址 ， 而 句柄 中 包含 了 对 象 
实例 数据 与 类 型 数据 各 自 的 具体 地 址 信息 ， 如 图 2-2 所 示 。 







Java 栈 ok 
本 地 变量 表 句柄 池 实例 池 





到 对 象 实例 数据 的 指针 


short 到 对 象 类 型 数据 的 指针 对 象 实例 数据 
reference gs 
| in | 





















( 对 象 类 型 数据 ) 











图 2-2 通过 句柄 访问 对 象 


如 果 使 用 直接 指针 访问 ， 那 么 Java 堆 对 象 的 布局 中 就 必须 考虑 如 何 
放置 访问 类 型 数据 的 相关 信息 ， 而 reference 中 存储 的 直接 就 是 对 象 地 
址 ， 如 图 2-3 所 示 。 









Java 推 


Java 栈 

本 地 变量 表 
a 到 对 象 类 型 数据 的 指针 
short 对 象 实例 数据 


reference 

















方法 区 


对 象 类 型 数据 








图 2-3 通过 直接 指针 访问 对 象 


这 两 种 对 象 访问 方式 各 有 优势 ， 使 用 句柄 来 访问 的 最 大 好 处 束 是 
reference 中 存储 的 是 稳定 的 句柄 地 址 ， 在 对 象 被 移动 〈 垃 圾 收集 时 移动 
对 象 是 非常 普遍 的 行为 ;时 只 会 改变 句柄 中 的 实例 数据 指针 ， 而 
reference 本 刁 不 需要 修改 。 











使 用 直接 指针 访问 方式 的 最 大 好 处 束 是 速度 更 快 ， 它 节省 了 一 次 指 
针 定 位 的 时 间 开 销 ， 由 于 对 象 的 访问 在 Java 中 非 第 频 坚 ， 因 此 这 类 开销 
识 少 成 多 后 也 是 一 项 非常 可 观 的 执行 成 本 。 残 本 书 讨论 的 主要 虚拟 机 
Sun HotSpot 而 言 ， 它 是 使 用 第 二 种 方式 进行 对 象 访问 的 ， 但 从 整个 软件 
开发 的 范围 来 看 ， 各 种 语言 和 框 杂 使 用 句柄 来 访问 的 情况 也 十 分 向 见 。 








2.4 ”实战 OutOfMemoryError 异 津 


在 Java 虚 拟 机 规范 的 描述 中 ， 除 了 程序 计数 器 外 ， 虚 拟 机 内 存 的 其 
他 几 个 运行 时 区 域 都 有 发 生 OutOfMemoryError 〈 下 文 称 OOM) 异常 的 
可 能 ， 本 节 将 通过 若干 实例 来 验证 异常 发 生 的 场景 (代码 清单 2-3~ 代 码 
清单 2-9 的 几 段 简单 代码 ) ， 并 且 会 初步 介绍 几 个 与 内 存 相 关 的 最 基本 
的 虚拟 机 参数 。 











本 节 内 容 的 目的 有 两 个 : 第 一 ， 通 过 代码 验证 Java 虚 拟 机 规范 中 描 
述 的 各 个 运行 时 区 域 存储 的 内 容 ， 第 二 ， 和 希望 读者 在 工作 中 遇 到 实际 的 
内 存 溢出 异常 时 ， 能 根据 异常 的 信息 快速 判断 是 哪个 区 域 的 内 存 溢出 ， 
知道 什么 样 的 代码 可 能 会 导致 这 些 区 域内 存 溢出 ， 以 及 出 现 这 些 异常 后 
该 如 何 处 理 。 











下 文 代码 的 开头 都 注释 了 执行 时 所 需要 设置 的 虚拟 机 启动 参数 〈 注 
释 中 "VM Args" 后面 跟着 的 参数 ) ， 这 些 参数 对 实验 的 结果 有 直接 影 
响 ， 读 者 调试 代码 的 时 候 千 万 不 要 忽略 。 如 果 读 者 使 用 控制 台 命 令 来 执 
行程 序 ， 那 直接 跟 在 Java 命 令 之 后 书写 就 可 以 。 如 果 读 者 使 用 Edlipse 
IDE， 则 可 以 参考 图 2-4 在 Debug/Run 页 签 中 的 设置 。 


Create, manage. and run configurations 
Debug a Java application 
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图 2-4 在 Eclipse 的 Debug 页 签 中 设置 虚拟 机 参数 


下 文 的 代码 都 是 基于 Sun 公 司 的 HotSpot 虚 拟 机 运行 的 ， 对 于 不 同 公 
司 的 不 同 版 本 的 虚拟 机 ， 参 数 和 程序 运行 的 结果 可 能 会 有 所 差别 。 


2.4.1 Java 堆 溢出 


Java 堆 用 于 存储 对 象 实 例 ， 只 要 不 断 地 创建 对 象 ， 并 且 保 证 GC 


Roots 到 对 象 之 间 有 可 达 路 径 来 避免 垃圾 回收 机 制 清 除 这 些 对 象 ， 那 么 
在 对 象 数 量 到 达 最 大 堆 的 容量 限制 后 就 会 产生 内 存 溢出 异常 。 


代码 清单 2-3 中 代码 限制 Java 堆 的 大 小 为 20MB， 不 可 扩展 (将 堆 的 
最 小 值 -Xms 参 数 与 最 大 值 -Xmx 参 数 设置 为 一 样 即 可 避免 堆 自动 扩 
展 ) ， 通 过 参数 -XX:+HeapDumpOnOutOfMemoryError 可 以 让 虚拟 机 在 
出 现 内 存 溢出 异常 时 Dump 出 当前 的 内 存 堆 转 储 快照 以 便 事后 进行 分 析 
[1] 








代码 清单 2-3 ”Java 堆 内 存 溢出 异常 测试 





/** 
*VM Args:-Xms20m-Xmx20m-XX:+HeapDumpOnOutOfMemoryError 
xQ@author zzm 














大 

public class HeapOOM{ 
static class OOMObJjectf{ 
} 





public static void main (String[]args) 1 
List<OOMObject~>1list=new ArrayList<OOMObject> (); 
while (true) { 

list.add (new OOMObject()); 























java.lang.OutOfMemoryError:Java heap space 
Dumping heap to java pid3404.hprof...... 
Heap dump file created[22045981 pytes in 0.663 secs] 

















Java 堆 内 存 的 OOM 异 常 是 实际 应 用 中 常见 的 内 存 溢出 异常 情况 。 当 
出 现 Java 堆 内 存 洲 出 时 ， 异 常 堆栈 信息 "java.lang.OutOfMemoryError" 会 


跟着 进一步 提示 "Java heap space"。 





要 解决 这 个 区 域 的 异 第 ， 一 般 的 手段 是 先 通过 内 存 映像 分 析 工 具 
(如 Eclipse Memory Analyzer) 对 Dump 出 来 的 堆 转 储 快照 进行 分 析 ， 重 
点 是 确认 内 存 中 的 对 象 是 否 是 必要 的 ， 也 就 是 要 先 分 清楚 到 底 是 出 现 了 
内 存 泄 漏 (Memory Leak) 还 是 内 存 淤 出 (Memory Overflow) 。 图 2-5 
显示 了 使 用 Eclipse Memory Analyzer 打 开 的 堆 转 储 快照 文件 。 
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图 2-5 使 用 Eclipse Memory Analyzer 打 开 的 堆 转 储 快照 文件 





如 果 是 内 存 汇 露 ， 可 进一步 通过 工具 查看 泄露 对 象 到 GC Roots 的 引 
用 链 。 于 是 就 能 找到 泄露 对 象 是 通过 怎样 的 路 径 与 GC Roots 相 关联 并 导 
致 垃圾 收集 器 无 法 自动 回收 它们 的 。 掌 握 了 泄露 对 象 的 类 型 信息 及 GC 
Roots 引 用 链 的 信息 ， 惑 可 以 比较 准确 地 定位 出 泄露 代码 的 位 置 。 








如 琳 不 存在 泄露 ， 换 句 话 说 ， 束 是 内 存 中 的 对 象 确实 部 还 必须 存活 
着 ， 那 就 应 当 检 查 虚 拟 机 的 堆 参 数 〈-Xmx 与 -Xms) ， 与 机 器 物理 内 存 
对 比 看 是 否 还 可 以 调 大 ， 从 代码 上 检查 是 否 存 在 某 些 对 象 生 命 周 期 过 
长 、 持 有 状态 时 间 过 长 的 情况 ， 尝 试 减少 程序 运行 期 的 内 存 消 耗 。 








以 上 是 处 理 Java 扒 内 存 问题 的 简单 思路 ， 处 理 这 些 问 题 所 需要 的 知 


识 、 工 具 与 经 验 是 后 面 3 草 的 主题 。 











四 关于 堆 转 储 快照 文件 分 析 方面 的 内 容 ， 可 参见 第 4 章 。 


2.4.2 ”虚拟 机 栈 和 本 地 方法 栈 溢出 


由 于 在 HotSpot 虚 拟 机 中 并 不 区 分 虚拟 机 栈 和 本 地 方法 栈 ， 因 此 ， 
对 于 HotSpot 来 说 ， 虽 然 -Xoss 参 数 〈 设 置 本 地 方法 栈 大 小 ) 存在 ， 但 实 
际 上 是 无 效 的 ， 栈 容量 只 由 -Xss 参 数 设 定 。 关 于 虚拟 机 栈 和 本 地 方法 
栈 ， 在 Java 虚 拟 机 规范 中 描述 了 两 种 异常 : 


如 琳 线 程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 最 大 深度 ， 将 抛 出 


StackOverflowError 异 常 。 





如 果 虚 拟 机 在 扩展 栈 时 无 法 申请 到 足够 的 内 存 空间 ， 则 抛 出 


OutOfMemoryError 异 常 。 
这 里 把 异常 分 成 两 种 情况 ， 看 似 更 加 严谨， 但 却 存 在 着 一 些 互 相 重 


合 的 地 方 ， 当 栈 空间 无 法 继续 分 配 时 ， 到 底 是 内 存 太 小 ， 还 是 已 使 用 的 
栈 空间 太 大 ， 其 本 质 上 只 是 对 同一 件 事情 的 两 种 描述 而 已 。 








在 笔者 的 实验 中 ， 将 实验 范围 限制 于 单线 程 中 的 操作 ， 尝 试 了 下 面 
两 种 方法 均 无 法 让 虚拟 机 产生 OutOfMemoryError 异 常 ， 尝 试 的 结果 都 是 
获得 StackOverflowError 异 常 ， 测 斌 代码 如 代码 清单 2-4 所 示 。 


使 用 -Xss 参 数 减 少 栈 内 存 容 量 。 结 果 : 抛 出 StackOverflowError 异 
和 常 ， 异 常 出 现时 输出 的 堆栈 深度 相应 缩小 。 


定义 了 大 量 的 本 地 变量 ， 增 大 此 方法 帧 中 本 地 变量 表 的 长 度 。 结 


果 : 抛 出 StackOverflowError 异 第 时 输出 的 堆栈 深度 相应 缩小 。 


代码 清单 2-4 虚拟 机 栈 和 本 地 方法 栈 OOM 测 试 〈“ 仅 作为 第 1 点 测试 


程序 ) 





/** 


*VM Args:-Xss1l28k 


*Qauthor zzm 


wy 








tackLengtht++t; 
tackLeak (); 


i i © 





ublic class JavaVMStackSOFI{ 
rivate int stackLength=1; 
ublic void stackLeak() { 





JavaVMStackSOF oom=new JavaVMStackSOF (); 


tryt 


oom.stackLeak () ; 
}catch (Throwable e) { 
System.out .println ("stack length:"+oom.stackLength) ; 








public static void main (String[]args) throws Throwablet{ 






























































throw e; 
} 
} 
} 
运行 结果 
stack length:2402 
Exception in thread"main"java.lang.StackOverflowError 
at org.fenixsoft.oom.VMStackSOF.leak (VMStackSOF.java:20) 
at org.fenixsoft.oom.VMStackSOF.leak (VMStackSOF.java:21) 
at org.fenixsoft.oom.VMStackSOF.leak (VMStackSOF.java:21) 
ey 后 续 异 常 堆栈 信息 省 略 











实验 结果 表明 : 在 单个 线程 下 ， 无 论 是 由 于 栈 帧 太 大 还 是 虚 拟 机 栈 


容量 太 小 ， 当 内 存 无 法 分 配 的 时 候 ， 虚 拟 机 抛 出 的 都 是 


StackOverflowError 异 常 。 


如 果 测 试 时 不 限于 单线 程 ， 通 过 不 断 地 建立 线程 的 方式 倒是 可 以 产 
生 内 存 淤 出 异 第 ， 如 代码 清单 2-5 所 示 。 但 是 这 样 产 生 的 内 存 洲 出 异常 
与 栈 空 间 是 人 否 足 够 大 并 不 存在 任何 联系 ， 或 者 准确 地 说 ， 在 这 种 情况 
下 ， 为 每 个 线程 的 栈 分 配 的 内 存 越 大 ， 反 而 越 容 易 产 生 内 存 流出 异常 。 


其 实 原因 不 难 理解 ， 操 作 系统 分 配给 每 个 进程 的 内 存 是 有 限制 的 ， 
譬如 32 位 的 windows 限 制 为 2GB 。 虚 拟 机 提供 了 参数 来 控制 Java 扒 和 方 
法 区 的 这 两 部 分 内 存 的 最 大 值 。 剩 余 的 内 存 为 2GB〈 操 作 系 统 限制 ) 减 
去 Xmx (最 大 堆 容量 ) ， 再 减 去 MaxPermSize (最 大 方法 区 容量 ) ， 程 
序 计 数 器 消耗 内 存 很 小 ， 可 以 忽略 掉 。 如 果 虚 拟 机 进程 本 身 耗 费 的 内 存 
不 计算 在 内 ， 剩 下 的 内 存 就 由 虚拟 机 栈 和 本 地 方法 栈 “ 瓜 分 "了 。 每 个 线 
程 分 配 到 的 栈 容量 越 大 ， 可 以 建立 的 线程 数量 自然 就 越 少 ， 建 立 线程 时 
就 越 容易 把 剩 下 的 内 存 耗 义 。 


这 一 点 读者 需要 在 开发 多 线程 的 应 用 时 特别 注意 ， 出 现 
StackOverflowError 异 常 时 有 错误 堆栈 可 以 阅读 ， 相 对 来 说 ， 比 较 容易 找 
到 问题 的 所 在 。 而 且 ， 如 果 使 用 虚拟 机 默认 参数 ， 栈 深度 在 大 多 数 情况 
下 《因为 每 个 方法 压 入 栈 的 帧 大 小 并 不 是 一 样 的 ， 所 以 只 能 说 在 大 多 数 
情况 下 ) 达到 1000~2000 完 全 没有 问题 ， 对 于 正 第 的 方法 调用 〈 包 括 递 
归 ) ， 这 个 深度 应 该 完全 够 用 了 。 但 是 ， 如 果 是 建立 过 多 线程 导致 的 内 


存 溢出 ， 在 不 能 减少 线程 数 或 者 更 换 64 位 虚拟 机 的 情况 下 ， 束 只 能 通过 
减少 最 大 堆 和 减少 栈 容量 来 换取 更 多 的 线程 。 如 果 没 有 这 方面 的 处 理 经 
验 ， 这 种 通过 “减少 内 存 ” 的 手段 来 解决 内 存 洪 出 的 方式 会 比较 难以 想 

到 。 





代码 清单 2-5 创建 线程 导致 内 存 游 出 异常 





/** 

*VM Args:-Xss2M (这 时 候 不 妨 设置 大 些 ) 
*Q@Qauthor zzm 

*/ 

public class JavaVMStackOOMI 

private void dontStop(){ 

while (true) { 

} 

} 

public void stackLeakByThread () { 

while (true) { 

Thread thread=new Thread (new Runnable() { 
QOverride 

public void run() { 

QontStop (); 

} 

} ) ; 

thread.start (); 

} 

} 

public static void main (String[]args) throws Throwablef{ 
JavaVMStackOOM oom=new JavaVMStackOOM () ; 
oom.stackLeakByThread () ; 

} 

} 




















注意 ”特别 提示 一 下 ， 如 果 读 者 要 尝试 运行 上 面 这 上 段 代 码 ， 记 得 要 
先 保 存 当 前 的 工作 。 由 于 在 Windows 平 台 的 虚拟 机 中 ，Java 的 线程 是 映 
射 到 操作 系统 的 内 核 线程 上 的 由， 因此 上 述 代码 执行 时 有 较 大 的 风险 ， 





可 能 会 导致 操作 系统 假死 。 

















Exception in thread"main"java.lang.OutOfMemoryError:unable to 
create new native thread 





[1 关于 虚拟 机 线程 实现 方面 的 内 容 可 以 参考 本 书 第 12 章 。 








2.4.3 ”方法 区 和 运行 时 常量 池 溢 出 








由 于 运行 时 常量 池 是 方法 区 的 一 部 分 ， 因 此 这 两 个 区 域 的 洲 出 测试 
就 放 在 一 起 进行 。 前 面 提 到 JDK 1.7 开 始 逐 步 “去 永久 代 ” 的 事情 ， 在 此 
就 以 测试 代码 观察 一 下 这 件 事 对 程序 的 实际 影 啊 。 








String.intern() 是 一 个 Native 方 法 ， 它 的 作用 是 : 如 果 字 符 串 常量 池 
中 已 经 包含 一 个 等 于 此 String 对 象 的 字符 串 ， 则 返回 代表 池 中 这 个 字符 
串 的 String 对 象 ， 否 则 ， 将 此 String 对 象 包含 的 字符 串 添 加 到 常量 池 中 ， 
并 且 返 Re 在 JDK 1.6 及 之 前 的 版 本 中 ， 由 于 常量 池 
分 配 在 永久 代 内 ， 我 们 可 以 通过 -XX:PermSize 和 -XX:MaxPermSize 限 制 
方法 区 大 小 ， 从 而 间接 限制 其 中 常量 池 的 容量 ， 如 代码 清单 2-6 所 示 。 


代码 清单 2-6 运行 时 常量 池 导 致 的 内 存 洲 出 异 第 





/** 

xVM Args:-XX:PermSize=l10M-XX:MaxPermSize=10OM 
*Q@Qauthor zzm 

4 

public class RuntimeConstantPoolOOMT{ 

public static void main (String[]args) 1 

// 使 用 Li st 保持 着 常量 池 引 用 ， 避 免 Full] GC 回收 常量 池 行 为 
List<String>list=new ArrayList<string> (); 
//10MB 的 PermSize 在 integer 范 围 内 足够 产生 oo0M 了 

int i=0; 

while (true) { 

list.add (String.valueOf (i++) .intern()) ; 

} 

} 

} 



































运行 结果 : 














Exception in thread"main"java.lang.OutOfMemoryError:PermGen space 
at java.lang.String.intern (Native Method) 

at 
org.fenixsoft.oom.RuntimeConstantPoolOOM.main (RuntimeConstantPoolOOM. 




















从 运行 结果 中 可 以 看 到 ， 运 行 时 常量 池 江 出 ， 在 OutOfMemoryError 
后 面 跟随 的 提示 信息 是 "PermGen space"， 说 明 运 行 时 常量 池 属 于 方法 区 
《HotSpot 虚 拟 机 中 的 永久 代 ) 的 一 部 分 


而 使 用 JDK 1.7 运 行 这 段 程序 就 不 会 得 到 相同 的 结果 ，while 循 环 将 
一 直 进 行 下 去 。 关 于 这 个 字符 串 常 量 池 的 实现 问题 ， 还 可 以 引申 出 一 个 
更 有 意思 的 影响 ， 如 代码 清单 2-7 所 示 。 





代码 清单 2-7 String.internO 返 回 引用 的 测试 





public class RuntimeConstantPoolOOMT{ 

public static void main (String[]args) 1 

public static void main (String[]args) 1 

String strl=new StringBuilder ("计算 机 ") .append(" 软 
件 ") .tostring (); 



























































System.out .println (strl.intern()==str1); 
String str2=new StringBuilder ("ja") .append ("va") .toString () ; 
System.out .println (str2.intern()==str2); 








} 
} 
} 





这 上 段 代 码 在 JDK 1.6 中 运行 ， 会 得 到 两 个 false， 而 在 JDK 1.7 中 运 
行 ， 会 得 到 一 个 tue 和 一 个 false。 产 生 差 异 的 原因 是 : 在 JDK 1.6 中 ， 





intern() 方 法 会 把 首次 遇 到 的 字符 串 实例 复制 到 永久 代 中 ， 返 回 的 也 是 永 
和 久 代 中 这 个 字符 串 实例 的 引用 ， 而 由 StringBuilder 创 建 的 字符 串 实例 在 
Java 推 上 ， 上 所 以 必然 不 是 同一 个 引用 ， 将 返回 false。 而 JDK 1.7《〈 以 及 部 
分 其 他 虚拟 机 ， 例 如 队 ockit) 的 intern0 实 现 不 会 再 复制 实例 ， 只 是 在 常 
量 池 中 记录 首次 出 现 的 实例 引用 ， 因 此 intern0 返 回 的 引用 和 由 
StringBuilder 创 建 的 那个 字符 串 实例 是 同一 个 。 对 str2 比 较 返 回 false 是 因 
为 "java" 这 个 字符 串 在 执行 StringBuilder.toString(O) 之 前 已 经 出 现 过 ， 字 符 
串 和 常量 池 中 己 经 有 它 的 引用 了 ， 不 符合 “首次 出 现 ” 的 原则 ， 而 “计算 机 
软件 ”这 个 字符 串 则 是 首次 出 现 的 ， 因 此 返回 true。 








方法 区 用 于 存放 Class 的 相关 信息 ， 如 类 名 、 访 问 修饰 符 、 常 量 池 、 
字段 描述 、 方 法 描述 等 。 对 于 这 些 区 域 的 测试 ， 基 本 的 思路 是 运行 时 产 
生 大 量 的 类 去 填 满 方法 区 ， 直 到 溢出 。 虽 然 直 接 使 用 Java SE API 也 可 以 
动态 产生 类 (如 反射 时 的 GeneratedConstructorAccessor 和 动态 代理 
等 ) ， 但 在 本 次 实验 中 操作 起 来 比较 麻烦 。 在 代码 清单 2-8 中 ， 笔 者 借 
助 CGLibl 直 接 操作 字 节 码 运行 时 生成 了 大 量 的 动态 














值得 特别 注意 的 是 ， 我 们 在 这 个 例子 中 模拟 的 场景 并 非 纯 粹 是 一 个 
实验 ， 这 样 的 应 用 经 常会 出 现在 实际 应 用 中 : 当前 的 很 多 主流 框架 ， 如 
Spring、Hibernate， 在 对 类 进行 增强 时 ， 都 会 使 用 到 CGLib 这 类 字 节 码 
技术 ， 增 强 的 类 越 多 ， 就 需要 越 大 的 方法 区 来 保证 动态 生成 的 Class 可 以 
加 载 入 内 存 。 另 外 ，JVM 上 的 动态 语言 (例如 Groovy 等 ) 通常 都 会 持续 





创建 类 来 实现 语言 的 动态 性 ， 随 着 这 类 语言 的 流行 ， 也 越 来 越 容易 过 到 


与 代码 清单 2-8 相 似 的 淤 出 场景 。 


代码 清单 2-8 ”借助 CGLib 使 方法 区 出 现 内 存 溢 





/** 

xVM Args :-XX:PermSize=10M-XX:MaxPermSize=10M 

xQ@author zzm 

*/ 

public class JavaMethodAreaOOMT{ 

public static void main (String[]args) 1 

while (true) { 

Enhancer enhancer=new Enhancer () ; 
enhancer.setSuperclass (OOMObject .class) ; 
enhancer.setUseCache (false) ; 
enhancer.setCallback (new MethodInterceptor(){ 
public Object intercept (Object obj,Method 

method,Object[]args,MethodProxy proxy) throws Throwable{ 
return proxy.invokeSuper (obj,args); 

} 

}); 

enhancer.create () ; 

} 

} 

static class OOMObJjectf{ 
} 

} 





























运行 结果 : 











Caused by:java.lang.OutOfMemoryError:PermGen space 

at java.lang.ClassLoader.defineClassl (Native Method) 

at java.lang.ClassLoader.defineClassCond (ClassLoader .java:632) 
at java.lang.ClassLoader.defineClass (ClassLoader.java:616) 
































方法 区 溢出 也 是 一 种 常见 的 内 存 游 出 异常 ， 一 个 类 要 被 垃圾 收集 器 








回收 掉 ， 判 定 条 件 是 比较 苛刻 的 。 在 经 常 动态 生成 大 量 Class 的 应 用 中 ， 
需要 特别 注意 类 的 回收 状况 。 这 类 场景 除了 上 面 提 到 的 程序 使 用 了 
CGLib 字 节 码 增强 和 动态 语言 之 外 ， 常 见 的 还 有 : 大 量 JSP 或 动态 产生 
JSP 文 件 的 应 用 (JSP 第 一 次 运行 时 需要 编译 为 Java 类 ) 、 基 于 OSGi 的 应 
用 《即使 是 同一 个 类 文件 ， 被 不 同 的 加 载 器 加 载 也 会 视 为 不 同 的 类 ) 


区 
等 。 




















[1]CGLib 开 源 项 目 : http://celib.sourceforge.net/。 


2.4.4 本 机 直接 内 存 溢出 


DirectMemory 容 量 可 通过 -XX:MaxDirectMemorySize 指 定 ， 如 果 不 
指定 ， 则 默认 与 Java 扒 最 大 值 (-Xmx 指 定 ) 一 样 ， 代 码 清单 2-9 越 过 了 
DirectByteBuffer 类 ， 直 接 通 过 反射 获取 Unsafe 实 例 进 行内 存 分 配 

(Unsafe 类 的 getUnsafe() 方 法 限制 了 只 有 引导 类 加 载 器 才 会 返回 实例 ， 
也 就 是 设计 者 希望 只 有 rt.jar 中 的 类 才能 使 用 Unsafe 的 功能 ) 。 因 为 ， 虽 
然 使 用 DirectByteBuffer 分 配 内 存 也 会 抛 出 内 存 溢出 异常 ， 但 它 抛 出 异常 
时 并 没有 真正 向 操作 系统 申请 分 配 内 存 ， 而 是 通过 计算 得 知 内 存 无 法 分 
配 ， 于 是 手动 抛 出 异常 ， 真 正 申 请 分 配 内 存 的 方法 是 


Unsafe.allocateMemory()。 








代码 清单 2-9 ”使 用 unsafe 分 配 本 机 内 存 





/** 

xVM Args:-Xmx20M-XX:MaxDirectMemorySize=10M 

*Q@Qauthor zzm 

*/ 

public class DirectMemoryOOM{ 

private static final int lMB=1024*1024; 

public static void main (String[]args) throws 了 Exceptiont{ 
Field unsafeField=Unsafe.class.getDeclaredFields () [0]; 
unsafeField.setAccessible (true) ; 
Unsafe unsafe= (Unsafe) unsafeField.get (Cnul1) ; 
while (true) { 

unsafe.allocateMemory ( 1MB) ; 

} 

} 

} 


一 | 

































































Exception in thread"main"java.lang.OutOfMemoryError 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at org.fenixsoft.oom.DMOOM.main (DMOOM.java:20) 





























由 DirectMemory 导 致 的 内 存 浇 出 ， 一 个 明显 的 特征 是 在 Heap Dump 
文件 中 不 会 看 见 明显 的 异常 ， 如 果 读 者 发 现 OOM 之 后 Dump 文 件 很 小 ， 
而 程序 中 又 直接 或 间接 使 用 了 NIO， 那 就 可 以 考虑 检查 一 下 是 不 是 这 方 
面 的 原因 。 














2.5 ”本 章 小 结 


通过 本 章 的 学 习 ， 我 们 明白 了 虚拟 机 中 的 内 存 是 如 何 划分 的 ， 哪 部 
分 区 域 、 什 么 样 的 代码 和 操作 可 能 导致 内 存 溢出 异 解 。 虽 然 Java 有 垃圾 
收集 机 制 ， 但 内 存 溢出 姑 御 离 我 们 仍然 并 不 遥远 ， 本 章 只 是 讲解 了 各 个 
区 域 出 现 内 存 溢出 异常 的 原因 ， 第 3 章 将 详细 讲解 Java 垃 圾 收集 机 制 为 
了 避免 内 存 洪 出 异 帝 的 出 现 都 做 了 哪些 努力 。 





第 3 章 ”垃圾 收集 瞩 与 内 存 分 配 东 上 略 
Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 “高 
墙 "， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 


3.1 ”概述 


说 起 垃圾 收集 (Garbage Collection,GC) ， 大 部 分 人 都 把 这 项 技术 
当做 Java 语 言 的 伴生 产物 。 事 实 上 ，GC 的 历史 比 Java 久 远 ，1960 年 诞生 
于 MIT 的 Lisp 是 第 一 门 真正 使 用 内 存 动态 分 配 和 垃圾 收集 技术 的 语言 。 
当 Lisp 还 在 胚胎 时 期 时 ， 人 们 就 在 思考 GC 需要 完成 的 3 件 事情 : 


哪些 内 存 需 要 回收 ? 
什么 时 候 回 收 ? 


如 何 回 收 ? 





经 过 半 个 多 世纪 的 发 展 ， 目 前 内 存 的 动态 分 配 与 内 存 回收 技术 已 经 
相当 成 熟 ， 一 切 看 起 来 都 进入 了 “自动 化 时代 ， 那 为 什么 我 们 还 要 去 了 
解 GC 和 内 存 分 配 呢 ? 答案 很 简单 : 当 需 要 排 伍 各 种 内 存 洲 出 、 内 存 泄 
漏 问 题 时 ， 当 也 圾 收集 成 为 系统 达到 更 高 并 发 量 的 上 瓶颈 时 ， 我 们 就 需要 
对 这 些 “ 上 自动 化 ?的 技术 实施 必要 的 监控 和 调节 。 








把 时 间 从 半 个 多 世纪 以 前 拨 回 到 现在 ， 回 到 我 们 熟悉 的 Java 语 言 。 
第 2 章 介 绍 了 Java 内 存 运 行 时 区 域 的 各 个 部 分 ， 其 中 程序 计数 器 、 虚 拟 
机 栈 、 本 地 方法 栈 3 个 区 域 随 线程 而 生 ， 随 线程 而 灭 ; 栈 中 的 栈 帧 随 着 
方法 的 进入 和 退出 而 有 条 不 率 地 执行 着 出 栈 和 入 栈 操作 。 每 一 个 栈 帧 中 
分 配 多 少 内 存 基本 上 是 在 类 结构 确定 下 来 时 就 已 知 的 (尽管 在 运行 期 会 
由 JIT 纺 译 需 进行 一 些 优化 ， 但 在 本 章 基 于 概念 模型 的 讨论 中 ， 大 体 上 
可 以 认为 是 编译 期 可 知 的 ) ， 因 此 这 几 个 区 域 的 内 存 分 配 和 回收 都 具备 
确定 性 ， 在 这 几 个 区 域内 就 不 需要 过 多 考虑 回收 的 问题 ， 因 为 方法 统 
或 者 线程 结束 时 ， 内 存 目 然 融 跟随 着 回收 了。 而 Java 推 和 方法 区 则 不 一 
样 ， 一 个 接口 中 的 多 个 实现 类 需要 的 内 存 可 能 不 一 样 ， 一 个 方法 中 的 多 
个 分 支 需 要 的 内 存 也 可 能 不 一 样 ， 我 们 只 有 在 程序 处 于 运行 期 间 时 才能 
知道 会 创建 哪些 对 象 ， 这 部 分 内 存 的 分 配 和 回收 都 是 动态 的 ， 垃 圾 收集 
器 所 关注 的 是 这 部 分 内 存 ， 本 章 后 续 讨 论 中 的 “内 存 ? 分 配 与 回收 也 仪 指 
这 一 部 分 内 存 。 





























3.2 对象 已 死 吗 


在 扒 里 面 存 放 着 Java 世 界 中 几乎 所 有 的 对 象 实例 ， 世 圾 收集 天 在 对 
堆 进行 回收 前 ， 第 一 件 事情 就 是 要 确定 这 些 对 象 之 中 哪些 还 “存活 ”着 ， 
哪些 已 经 “死去 ”( 即 不 可 能 再 被 任何 途径 使 用 的 对 象 )。 








3.2.1 引用 计数 算法 


很 多 教科 书 判断 对 象 是 否 存 活 的 算法 是 这 样 的 : 给 对 象 中 添加 一 个 
引用 计数 器 ， 每 当 有 一 个 地 方 引用 它 时 ， 计 数 器 值 就 加 1; 当 引 用 失效 
时 ， 计 数 需 值 就 减 1， 任何 时 刻 计 数 器 为 0 的 对 象 就 是 不 可 能 再 被 使 用 
的 。 作 者 面试 过 很 多 的 应 届 生 和 一 些 有 多 年 工作 经 验 的 开发 人 员 ， 他 们 


对 于 这 个 问题 给 予 的 都 是 这 个 答案 。 


客观 地 说 ， 引 用 计数 算法 〈Reference Counting) 的 实现 简单 ， 判 定 
效率 也 很 高 ， 在 大 部 分 情况 下 它 都 是 一 个 不 错 的 算法 ， 也 有 一 些 比较 著 
名 的 应 用 案例 ， 例 如 微软 公司 的 COM (Component Object Model) 技 
术 、 使 用 ActionScript 3 的 FlashPlayer、Python 语 言 和 在 游戏 脚本 领域 被 
广泛 应 用 的 Squirrel 中 都 使 用 了 引用 计数 算法 进行 内 存 管理 。 但 是 ， 至 
少 主流 的 Java 虚 拟 机 里 面 没 有 选用 引用 计数 算法 来 管理 内 存 ， 其 中 最 主 
要 的 原因 是 它 很 难 解决 对 象 之 间 相 互 循 环 引用 的 问题 。 








举 个 简单 的 例子 ， 请 看 代码 清单 3-1 中 的 testGC0) 方 法 : 对 象 objA 和 
objB 都 有 字段 instance， 赋 值 令 objA.instance=objB 及 
objB.instance=objA， 除 此 之 外 ， 这 两 个 对 象 再 无 任何 引用 ， 实 际 上 这 两 
个 对 象 已 经 不 可 能 再 被 访问 ， 但 是 它们 因为 互相 引用 着 对 方 ， 导 致 它们 
的 引用 计数 都 不 为 0， 于 是 引用 计数 算法 无 法 通知 GC 收 集 器 回收 它们 。 














代码 清单 3-1 引用 计数 算法 的 缺陷 





/** 

*testGC () 方 法 执行 后 ，objA 和 objB 会 不 会 被 ec 呢 ? 
*Q@Qauthor zzm 

4 

public class ReferenceCountingGcC{ 

public Object instance=null; 

private static final int lMB=1024*1024; 












































/** 
* 这 个 成 员 属 性 的 唯一 音义 就 是 占 点 内 存 ， 以 便 能 在 GC 日 志 中 看 清楚 是 否 被 回收 过 
*/ 





private byte[l]lbigSize=new byte[2* 1MB]; 

public static void testGC () { 

ReferenceCountingGC objA=new ReferenceCountingGC () ; 
ReferenceCountingGC objB=new ReferenceCountingGC () ; 
objA.instance=objB; 
objB.instance=objA:; 
objA=null; 
objB=nul] 
/7 很 设 在 这 行 发 生 Gc， objA 和 objB 是 否 能 被 回收 ? 
System.gc (); 

} 

} 

































































运行 结果 : 





[Eul1 GC (System) [Tenured:0K->210K (10240K) ， 0.0149142 
secs] 4603K->>210K (19456K) ， [Perm:2999K->2999K (21248K) ]，0.0150007 
secs] [Times:user=0.01 sys=0.00, real=0.02 secs|] 


Heap 

def new generation total 9216K,used 82K[0x00000000055e0000， 
0x0000000005fe0000，0x0000000005fe0000) 
Eden space 8192K, l%used[0x00000000055e0000,， 0x00000000055f£f4850， 
0x0000000005de0000) 
from space 1024K, 0%used[0x0000000005de0000,， 0x0000000005de0000， 
0x0000000005ee0000) 
to space 1024K, 0%Sused[0x0000000005ee0000,， 0x0000000005ee0000， 
0x0000000005fe0000) 
tenured generation total 10240K,used 210K[0x0000000005fe0000， 
0x00000000069e0000，0x00000000069e0000) 
the space 10240K，2susedq[0x0000000005fe0000，0x0000000006014a18， 
0x0000000006014c00，0x00000000069e0000) 

compacting perm gen total 21248K,used 3016K[0x00000000069e0000， 
0x0000000007ea0000，0x000000000bde0000) 

the space 21248K, 14%used[0x00000000069e0000,，0x0000000006cqd2398,， 
0x0000000006cq2400，0x0000000007ea0000) 

No shared spaces configured. 












































从 运行 结果 中 可 以 清楚 看 到 ，GC 日 志 中 包含 "4603K- 之 210K"， 意 
味 着 虚拟 机 并 没有 因为 这 两 个 对 象 互相 引用 就 不 回收 它们 ， 这 也 从 侧面 
说 明 虚 拟 机 并 不 是 通过 引用 计数 算法 来 判断 对 象 是 否 存活 的 。 


3.2.2 ”可 达 性 分 析 算 法 


在 主流 的 商用 程序 语言 (Java、C#， 甚 至 包括 前 面 提 到 的 古老 的 
Lisp) 的 主流 实现 中 ， 都 是 称 通过 可 达 性 分 析 (Reachability Analysis ) 
来 判定 对 象 是 否 存活 的 。 这 个 算法 的 基本 思路 就 是 通过 一 系列 的 称 
为 "GC Roots" 的 对 象 作 为 起 始点 ， 从 这 些 节点 开始 向 下 搜索 ， 搜 索 所 走 
过 的 路 径 称 为 引用 链 (Reference Chain) ， 当 一 个 对 象 到 GC Roots 没 有 
任何 引用 链 相 连 (用 图 论 的 话 来 说 ， 就 是 从 GC Roots 到 这 个 对 象 不 可 
达 ) 时 ， 则 证 明 此 对 象 是 不 可 用 的 。 如 图 3-1 所 示 ， 对 象 object 5、object 
6、object 7 虽然 互相 有 关联 ， 但 是 它们 到 GC Roots 是 不 可 达 的 ， 所 以 它 
们 将 会 被 判定 为 是 可 回收 的 对 象 。 












国 人 切 然 存活 的 对 象 
口 判定 可 辕 收 的 对 象 


图 3-1 可 达 性 分 析 章 法 判定 对 象 是 否 可 回收 
在 Java 语 言 中 ， 可 作为 GC Roots 的 对 象 包括 下 面 几 种 : 
虚拟 机 栈 《〈 栈 帧 中 的 本 地 变量 表 ) 中 引用 的 对 象 。 
方法 区 中 类 静态 属性 引用 的 对 象 。 
方法 区 中 常量 引用 的 对 象 。 


本 地 方法 栈 中 JNI 即 一 般 说 的 Native 方 法 ) 引用 的 对 象 。 


3.2.3 ”再 谈 引 用 





无 论 是 通过 引用 计数 算法 判断 对 象 的 引用 数量 ， 还 是 通过 可 达 性 分 
析 算 法 判断 对 象 的 引用 链 是 否 可 达 ， 判 定 对 象 是 否 存活 都 与 “引用 ”有 
天 。 在 JDK 1.2 以 前 ，Java 中 的 引用 的 定义 很 传统 : 如 果 reference 类 型 的 
数据 中 存储 的 数值 代表 的 是 另外 一 块 内 存 的 起 始 地 址 ， 就 称 这 块 内 存 代 
表 着 一 个 引用 。 这 种 定义 很 纯粹 ， 但 是 太 过 狭隘 ， 一 个 对 象 在 这 种 定义 
下 只 有 被 引用 或 者 没有 被 引用 两 种 状态 ， 对 于 如 何 描述 一 些 “ 食 之 无 
味 ， 弃 之 可 惜 ” 的 对 象 就 显得 无 能 为 力 。 我 们 希望 能 描述 这 样 一 类 对 
象 : 当 内 存 空间 还 足够 时 ， 则 能 保留 在 内 存 之 中 ; 如 果 内 存 空 间 在 进行 
垃圾 收集 后 还 是 非常 紧张 ， 则 可 以 抛弃 这 些 对 象 。 很 多 系统 的 缓存 功能 
都 符合 这 样 的 应 用 场景 。 











在 JDK 1.2 之 后 ，Java 对 引用 的 概念 进行 了 扩充 ， 将 引用 分 为 强 引 用 
(Strong Reference) 、 软 引用 〈Soft Reference) 、 弱 引用 (Weak 
Reference) 、 虚 引用 〈Phantom Reference) 4 种 ， 这 4 种 引用 强度 依次 逐 
渐 减 弱 。 








强 引 用 就 是 指 在 程序 代码 之 中 普 遇 存在 的 ， 类 似 "Object obj=new 
Object0" 这 类 的 引用 ， 只 要 强 引 用 还 存在 ， 垃 圾 收集 器 永远 不 会 回收 挥 
被 引用 的 对 象 。 








软 引用 是 用 来 描述 一 些 还 有 用 但 并 非 必需 的 对 象 。 对 于 软 引 用 关联 
着 的 对 象 ， 在 系统 将 要 发 生 内 存 溢出 异常 之 前 ， 将 会 把 这 些 对 象 列 进 回 
收 荡 围 之 中 进行 第 二 次 回收 。 如 果 这 次 回收 还 没有 足够 的 内 存 ， 才 会 抛 
出 内 存 洲 出 异常 。 在 JDK 1.2 之 后 ， 提 供 了 SoftReference 类 来 实现 软 引 
用 。 








弱 引 用 也 是 用 来 描述 非 必需 对 象 的 ， 但 是 它 的 强度 比 软 引 用 更 弱 一 
些 ， 被 弱 引用 关联 的 对 象 只 能 生存 到 下 一 次 垃圾 收集 发 生 之 前 。 当 垃圾 
收集 器 工作 时 ， 无 论 当前 内 存 是 否 足够 ， 都 会 回收 掉 只 被 弱 引 用 关联 的 
对 象 。 在 JDK 1.2 之 后 ， 提 供 了 WeakReference 类 来 实现 弱 引 用 。 


虚 引 用 也 称 为 幽灵 引用 或 者 约 影 引用 ， 它 是 最 弱 的 一 种 引用 关系 。 
一 个 对 象 是 否 有 虚 引 用 的 存在 ， 完 全 不 会 对 其 生存 时 间 构 成 影响 ， 也 无 
法 通过 虚 引 用 来 取得 一 个 对 象 实例 。 为 一 个 对 象 设置 虚 引 用 关联 的 唯一 
目的 就 是 能 在 这 个 对 象 被 收集 器 回收 时 收 到 一 个 系统 通知 。 在 JDK 1.2 
之 后 ， 提 供 了 PhantomReference 类 来 实现 虚 引 用 。 

















3.2.4 生存 还 是 死亡 


即使 在 可 达 性 分 析 算 法 中 不 可 达 的 对 象 ， 也 并 非 是 “ 非 死 不 可 ”的 ， 
这 时 候 它们 暂时 处 于 “缓刑 阶段， 要 真正 宣告 一 个 对 象 死 亡 ， 至 少 要 经 
历 两 次 标记 过 程 : 如 果 对 象 在 进行 可 达 性 分 析 后 发 现 没 有 与 GC Roots 相 
连接 的 引用 链 ， 那 它 将 会 被 第 一 次 标记 并 且 进 行 一 次 筛选 ， 筛 选 的 条 件 
是 此 对 象 是 否 有 必要 执行 finalize0) 方 法 。 当 对 象 没 有 履 盖 finalize() 方 
法 ， 或 者 finalize() 方 法 已 经 被 虚拟 机 调用 过 ， 虚 拟 机 将 这 两 种 情况 都 视 
为 “没有 必要 执行 ”。 











如 果 这 个 对 象 被 判定 为 有 必要 执行 finalize() 方 法 ， 那 么 这 个 对 象 将 
会 放置 在 一 个 叫做 F-Queue 的 队列 之 中 ， 并 在 稍 后 由 一 个 由 虚拟 机 自动 
建立 的 、 低 优先 级 的 Finalizer 线 程 去 执行 它 。 这 里 所 谓 的 “执行 ?是 指 虚 
拟 机 会 触发 这 个 方法 ， 但 并 不 承诺 会 等 待 它 运行 结 束 ， 这 样 做 的 原因 
是 ， 如 果 一 个 对 象 在 finalize() 方 法 中 执行 缓慢 ， 或 者 发 生 了 死 循环 (更 
极端 的 情况 ) ， 将 很 可 能 会 导致 F-Queue 队 列 中 其 他 对 象 永久 处 于 等 
待 ， 甚 至 导致 整个 内 存 回收 系统 崩溃 。finalize() 方 法 是 对 象 逃 脱 死亡 命 
运 的 最 后 一 次 机 会 ， 稍 后 GC 将 对 F-Queue 中 的 对 象 进行 第 二 次 小 规模 的 
标记 ， 如 果 对 象 要 在 finalize() 中 成 功 拯救 自己 一 一 只 要 重新 与 引用 链 上 
的 任何 一 个 对 象 建立 关联 即 可 ， 壁 如 把 自己 (this 关 键 字 〉 赋值 给 某 个 
类 变量 或 者 对 象 的 成 员 变 量 ， 那 在 第 二 次 标记 时 它 将 被 移 除 出 “即将 回 














收 ?的 集合 ， 如 果 对 象 这 时 候 还 没有 逃脱 ， 那 基本 上 和 就 真 的 被 回收 
了 。 从 代码 清单 3-2 中 我 们 可 以 看 到 一 个 对 象 的 finalize0 被 执行 ， 但 是 它 


仍然 可 以 存活 。 





代码 清单 3-2 ”一 次 对 象 目 我 拯救 的 演示 





/** 
* 此 代码 演示 了 两 点 : 





*1 .对 象 可 以 在 被 SC 时 自我 拯救 。 





*2 .这 种 自救 的 机 会 只 有 一 次 ， 
用 一 次 
*Qauthor zzm 


*y 








因为 一 个 对 象 的 finalize () 方法 最 多 只 会 被 系统 上 自动 调 





public class FinalizeEscapeGcC { 


public static Finalizel 





EscapeGC SAVE HOOK=null; 








public void isAlive(){ 








System.out.println ("yes,i am still alive:) ") ; 


} 


QOverride 





protected void finalize()throws Throwablef 





super.finalize (); 
System.out.println ("fi 











nalize mehtod executed!").; 








FinalizeEscapeGC.SAVE 
} 





HOOK=this; 





public static void main (String[]args) throws Throwablef{ 


SAVE HOOK=new Finalizel 
// 对 象 第 一 次 成 功 拯救 自己 
SAVE HOOK=null; 
System.gc (); 














PscapeGcC (); 


// 因 为 fijnalize 方 法 优先 级 很 低 ， 所 以 暂停 0 .5 秒 以 等 待 它 


Thread.sleep (500) ; 
if (SAVE _HOOK1!=nul1) { 
SAVE HOOK.isAlive(); 
}elsel{ 














System.out .println ("no,i am dead: (") ; 


} 








/ /下面 这 段 代 码 与 上 面 的 完全 相同 ， 但 是 这 次 自救 却 失败 了 











SAVE HOOK=null; 
System.gc (); 








// 因 为 fijnalize 方 法 优先 级 很 低 ， 所 以 暂停 0 .5 秒 以 等 待 它 








Thread.sleep (500) ; 
if (SAVE HOOK!=null) { 











SAVE HOOK. isAlive(); 
}elsef{ 
System.out .println ("no,i am dead: (") ; 











finalize mehtod executed! 
yes,i am still alive:) 
no,i am dead: ( 


从 代码 清单 3-2 的 运行 结果 可 以 看 出 ，SAVE_HOOK 对 象 的 finalize() 
方法 确实 被 GC 收 集 器 触发 过 ， 并 且 在 被 收集 前 成 功 逃 脱 了 。 





另外 一 个 值得 注意 的 地 方 是 ， 代 码 中 有 两 段 完 全 一 样 的 代码 片段 ， 
执行 结果 却 是 一 次 逃脱 成 功 ， 一 次 失败 ， 这 是 因为 任何 一 个 对 象 的 
finalize(0 方 法 都 只 会 被 系统 目 动 调用 一 次 ， 如 果 对 象 面 临 下 一 次 回收 ， 
它 的 finalize() 方 法 不 会 被 再 次 执行 ， 因 此 第 二 段 代 码 的 自救 行动 失败 
1 





需要 特别 说 明 的 是 ， 上 面 天 于 对 象 死 亡 时 finalize() 方 法 的 描述 可 能 
带 有 坦 情 的 艺术 色彩 ， 笔 者 并 不 鼓励 大 家 使 用 这 种 方法 来 拯救 对 象 。 相 
反 ， 笔 者 建议 大 家 尽量 避免 使 用 它 ， 因 为 它 不 是 C/C++ 中 的 析 构 函数 ， 
而 是 Java 刚 诞生 时 为 了 使 C/C++ 程序 员 更 容易 接受 它 所 做 出 的 一 个 受 
协 。 它 的 运行 代价 高 郧 ， 不 确定 性 大 ， 无 法 保证 各 个 对 象 的 调用 顺序 。 
有 些 教材 中 描述 它 适 合 做 “关闭 外 部 资源 ?之 类 的 工作 ， 这 完全 是 对 这 个 











方法 用 途 的 一 种 自我 安慰。finalize0) 能 做 的 所 有 工作 ， 使 用 try-finally 或 
者 其 他 方式 都 可 以 做 得 更 好 、 更 及 时 ， 所 以 笔者 建议 大 家 完全 可 以 忘掉 
Java 语 言 中 有 这 个 方法 的 存在 。 





3.2.5 回收 方法 区 


很 多 人 认为 方法 区 〈 或 者 HotSpot 虚 拟 机 中 的 永久 代 ) 是 没有 垃圾 
收集 的 ，Java 虚 拟 机 规范 中 确实 说 过 可 以 不 要 求 虚 拟 机 在 方法 区 实现 二 
圾 收集 ， 而 且 在 方法 区 中 进行 垃圾 收集 的 “性 价 比 "一般 比 较 低 : 在 堆 
中 ， 尤 其 是 在 新 生 代 中 ， 常 规 应 用 进行 一 次 垃圾 收集 一 般 可 以 回收 
709%6~95% 的 空间 ， 而 永久 代 的 垃圾 收集 效率 远 低 于 此 。 











永久 代 的 垃圾 收集 主要 回收 两 部 分 内 容 ， 废 弃 和 常量 和 无 用 的 类 。 回 
收 废弃 第 量 与 回收 Java 堆 中 的 对 象 非 第 类 似 。 以 常量 池 中 字面 量 的 回收 
为 例 ， 假 如 一 个 字符 串 "abc" 已 经 进入 了 常量 池 中 ， 但 是 当前 系统 没有 
任何 一 个 String 对 象 是 叫做 "abc" 的 ， 换 句 话 说 ， 就 是 没有 任何 String 对 象 
引用 常量 池 中 的 "abc" 常 量 ， 也 没有 其 他 地 方 引 用 了 这 个 字面 量 ， 如 果 
这 时 发 生 内 存 回收 ， 而 且 必要 的 话 ， 这 个 "abc" 名 量 束 会 被 系统 清理 出 
常量 池 。 常 量 池 中 的 其 他 类 (接口 )、 方 法 、 字 上 段 的 符号 引用 也 与 此 类 
似 。 























判定 一 个 常量 是 否 是 “废弃 常量 ”比较 人 简单， 而 要 判定 一 个 类 是 否 
是 “无 用 的 类 ”的 条 件 则 相对 苛刻 许多 。 类 雷 要 同时 满足 下 面 3 个 条 件 才 
能 算是 “无 用 的 类 >”: 





该 类 所 有 的 实例 都 已 经 被 回收 ， 也 就 是 Java 推 中 不 存在 该 类 的 任何 


实例 。 


加 载 该 类 的 ClassLoader 已 经 被 回收 。 


» 


该 类 对 应 的 java.lang.Class 对 象 没有 在 任何 地 方 被 引用 ， 无 法 在 任何 
地 方 通过 反射 访问 该 类 的 方法 。 


虚拟 机 可 以 对 满足 上 述 3 个 条 件 的 无 用 类 进行 回收 ， 这 里 说 的 仅仅 
是 “可 以 ”， 而 并 不 是 和 对 象 一 样 ， 不 使 用 了 就 必然 会 回收 。 是 否 对 类 进 
行 回 收 ，HotSpot 虚 拟 机 提供 了 -Xnoclassgc 参 数 进行 控制 ， 还 可 以 使 用 - 
verbose:class 以 及 -XX:+TraceClassLoading、-XX:+TraceClassUnLoading 
查看 类 加 载 和 介 载 信息 ， 其 中 -verbose:class 和 -XX:+TraceClassLoading 可 
以 在 Product 版 的 虚拟 机 中 使 用 ，-XX:+TraceClassUnLoading 参 数 需 要 
FastDebug 版 的 虚拟 机 文 持 。 


在 大 量 使 用 反射 、 动 态 代 理 、CGLib 等 ByteCode 框 架 、 动 态 生成 
JSP 以 及 OSGi 这 类 频繁 自 定 义 ClassLoader 的 场景 都 需要 虚拟 机 具备 类 利 
载 的 功能 ， 以 保证 永久 代 不 会 溢出 。 





3.3 二 圾 收集 算法 








由 于 垃圾 收集 算法 的 实现 涉及 大 量 的 程序 细节 ， 而 且 各 个 平台 的 虚 
拟 机 操作 内 存 的 方法 又 各 不 相同 ， 因 此 本 节 不 打算 过 多 地 讨论 算法 的 实 
现 ， 只 是 介绍 几 种 算法 的 思想 及 其 发 展 过 程 。 





3.3.1 标记 -清除 算法 


最 基础 的 收集 算法 是 “标记 -清除 ”(Mark-Sweep) 算法， 如 同 它 的 
名 字 一 样 ， 算 法 分 为 “标记 ”和 ?清除 ?两 个 阶段 : 首先 标记 出 所 有 需要 回 
收 的 对 象 ， 在 标记 完成 后 统一 回收 所 有 被 标记 的 对 象 ， 它 的 标记 过 程 其 
实在 前 一 节 讲 述 对 象 标记 判定 时 已 经 介绍 过 了 。 之 所 以 说 它 是 最 基础 的 
收集 算法 ， 是 因为 后 续 的 收集 算法 都 是 基于 这 种 思路 并 对 其 不 足 进 行 改 
进而 得 到 的 。 它 的 主要 不 足 有 两 个 : 一 个 是 效率 问题 ， 标 记 和 清除 两 个 
过 程 的 效率 都 不 高 ， 男 一 个 是 空间 问题 ， 标 记 清 除 之 后 会 产生 大 量 不 连 
续 的 内 存 碎 片 ， 空 间 碎 片 太 多 可 能 会 导致 以 后 在 程序 运行 过 程 中 需要 分 
配 较 大 对 象 时 ， 无 法 找到 足够 的 连续 内 存 而 不 得 不 提前 触发 另 一 次 垃圾 
收集 动作 。 标 记 一 清除 算法 的 执行 过 程 如 图 3-2 所 示 。 














图 ”3-2 “标记 -清除 ”算法 示意 图 


3.3.2， 受 侧 算 儒 


为 了 解决 效率 问题 ， 一 种 称 为 “复制 ”(Copying) 的 收集 算法 出 现 

了 ， 它 将 可 用 内 存 按 容 量 划 分 为 大 小 相等 的 两 块 ， 每 次 只 使 用 其 中 的 一 
块 。 当 这 一 块 的 内 存 用 完了 ， 束 将 还 存活 着 的 对 象 复 制 到 为 外 一 块 上 

面 ， 然 后 再 把 已 使 用 过 的 内 存 空间 一 次 清理 挤 。 这 样 使 得 每 次 都 是 对 整 
个 半 区 进行 内 存 回收 ， 内 存 分 配 时 也 就 不 用 考虑 内 存 碎 片 等 复杂 情况 ， 
只 要 移动 堆 顶 指针 ， 按 顺序 分 配 内 存 即 可 ， 实 现 简 单 ， 运 行 高 效 。 只 是 
这 种 算法 的 代价 是 将 内 存 缩小 为 了 原来 的 一 半 ， 未 免 太 高 了 一 点 。 复 制 
算法 的 执行 过 程 如 图 3-3 所 示 。 


























图 3-3 复制 算法 示意 图 


现在 的 商业 虚拟 机 都 采用 这 种 收集 算法 来 回收 新 生 代 ，IBM 公 司 的 
专门 研究 表明 ， 新 生 代 中 的 对 象 98% 是 “ 朝 生 夕 死 "的 ， 所 以 并 不 需要 按 
照 1:1 的 比例 来 划分 内 存 空间 ， 而 是 将 内 存 分 为 一 块 较 大 的 Eden 空 间 和 
两 块 较 小 的 Survivor 空 间 ， 每 次 使 用 Eden 和 其 中 一 块 Survivor。 当 回收 
时 ， 将 Eden 和 Survivor 中 还 存活 着 的 对 象 一 次 性 地 复制 到 另外 一 块 
Survivor 空 间 上 ， 最 后 清理 挥 Eden 和 刚才 用 过 的 Survivor 空 间 。HotSpot 
虚拟 机 默认 Eden 和 Survivor 的 大 小 比例 是 8:1， 也 就 是 每 次 新 生 代 中 可 用 
内 存 空 间 为 整个 新 生 代 容量 的 90% (80%+10%) ， 只 有 10% 的 内 存 会 
被 < 浪费”。 当 然 ，98% 的 对 象 可 回收 只 是 一 般 场 景 下 的 数据 ， 我 们 没有 
办 法 保证 每 次 回收 都 只 有 不 多 于 10% 的 对 象 存活 ， 当 Survivor 空 间 不 够 
用 时 ， 需 要 依赖 其 他 内 存 〈 这 里 指 老 年 代 ) 进行 分 配 担保 〈Handle 


Promotion ) 。 

















内 存 的 分 配 担保 就 好 比 我 们 去 银行 借 球 ， 如 果 我 们 信誉 很 好 ， 在 
98% 的 情况 下 都 能 按时 偿还 ， 于 是 银行 可 能 会 默认 我 们 下 一 次 也 能 按时 
按 量 地 途 还 贷款 ， 只 需要 有 一 个 担保 人 能 保证 如 果 我 不 能 还 款 时 ， 可 以 
从 他 的 账户 扣 钱 ， 那 银行 就 认为 没有 风险 了 。 内 存 的 分 配 担 保 也 一 样 ， 
如 果 男 外 一 块 Survivor 空 间 没有 足够 空间 存放 上 一 次 新 生 代 收集 下 来 的 
存活 对 象 时 ， 这 些 对 象 将 直接 通 过 分 配 担保 机 制 进入 老年 代 。 关 于 对 新 
生 代 进 行 分 配 担 保 的 内 容 ， 在 本 半 稍 后 在 讲解 垃圾 收集 占 执 行规 则 时 还 
会 再 详细 讲解 。 








四 这 里 需要 说 明 一 下 ， 在 HotSpot 中 的 这 种 分 代 方 式 从 最 初 就 是 这 种 布 
局 ， 与 IBM 的 研究 并 没有 什么 实际 联系 。 本 书 列举 IBM 的 研究 只 是 为 了 
说 明 这 种 分 代 布 局 的 意义 所 在 。 


3.3.3 标记 -至 理 复 法 








复制 收集 算法 在 对 象 存活 率 较 高 时 就 要 进行 较 多 的 复制 操作 ， 效 率 
将 会 变 低 。 更 关键 的 是 ， 如 果 不 想 浪费 50% 的 空间 ， 残 需要 有 和 额外 的 空 
间 进 行 分 配 担 保 ， 以 应 对 被 使 用 的 内 存 中 所 有 对 象 都 100% 存 活 的 极 站 
情况 ， 所 以 在 老年 代 一 般 不 能 直接 选用 这 种 算法 。 








根据 老年 代 的 特点 ， 有 人 提出 了 另外 一 种 “标记 -整理 ”(Mark- 
Compact) 算法 ， 标 记过 程 仍然 与 “标记 -清除 ”算法 一 样 ， 但 后 续 步 又 不 
是 直接 对 可 回收 对 象 进行 清 理 ， 而 是 让 所 有 存活 的 对 象 都 同一 问 移 动 ， 
然后 直接 清理 掉 端 边界 以 外 的 内 存 , “标记 -整理 ”算法 的 示意 图 如 图 3-4 
所 示 。 























存活 对 每 可 回收 未 使 用 


图 3-4 标记 -整理 ”算法 示意 图 


3.3.4 ”分 代 收 集 算 法 


当前 商业 虚拟 机 的 垃圾 收集 都 采用 “分 代 收 集 ”( Generational 

Collection) 算法 ， 这 种 算法 并 没有 什么 新 的 思想 ， 只 是 根据 对 象 存活 周 
期 的 不 同 将 内 存 划 分 为 几 块 。 一 般 是 把 Java 扒 分 为 新 生 代 和 老年 代 ， 这 
样 就 可 以 根据 各 个 年 代 的 特点 采用 最 适当 的 收集 算法 。 在 新 生 代 中 ， 
次 垃圾 收集 时 都 发 现 有 大 批 对 象 死 去 ， 只 有 少量 存活 ， 那 就 选用 复制 算 
法 ， 只 需要 付出 少量 存活 对 象 的 复制 成 本 就 可 以 完成 收集 。 而 老年 代 中 
因为 对 象 存活 率 高 、 没 有 额外 空间 对 它 进行 分 配 担 保 ， 就 必须 使 用 * 标 
记 一 清理 ”或 者 “标记 一 整理 ”算法 来 进行 回收 。 








3.4 ” HotSpot 的 算法 实现 


3.2” 节 和 3.3 节 从 理论 上 介绍 了 对 象 存活 判定 算法 和 垃圾 收集 算 
法 ， 而 在 HotSpot 虚 拟 机 上 实现 这 些 算法 时 ， 必 须 对 算法 的 执行 效率 有 
严格 的 考量 ， 才 能 保证 虚拟 机 高 效 运行 。 





3.4.1 枚 举 根 节 点 


从 可 达 性 分 析 中 从 GC Roots 市 点 找 引 用 链 这 个 操作 为 例 ， 可 作为 
GC Roots 的 节点 主要 在 全 局 性 的 引用 例如 常量 或 类 静态 属性 ) 与 执行 
上 下 文 (例如 栈 帧 中 的 本 地 变量 表 )〉 中 ， 现 在 很 多 应 用 仅仅 方法 区 就 有 
数 百 兆 ， 如 果 要 逐个 检查 这 里 面 的 引用 ， 那 么 必然 会 消耗 很 多 时 间 。 

















男 外 ， 可 达 性 分 析 对 执行 时 间 的 敏感 还 体现 在 GC 停顿 上 ， 因 为 这 
分 析 工 作 必须 在 一 个 能 确保 一 致 性 的 快照 中 进行 一 一 这 里 “一 致 性 ”的 
意思 是 指 在 整个 分 析 期 间 整 个 执行 系统 看 起 来 就 像 被 冻结 在 某 个 时 间 点 
上 ， 不 可 以 出 现 分 析 过 程 中 对 象 引 用 关系 还 在 不 断 变化 的 情况 ， 该 点 不 
满足 的 话 分 析 结 果 准 确 性 就 无 法 得 到 保证 。 这 点 是 导致 GC 进 行 时 必须 
停顿 所 有 Java 执 行 线程 《Sun 将 这 件 事情 称 为 "Stop The World") 的 其 中 
一 个 重要 原因 ， 即 使 是 在 号 称 〈 几 乎 ) 不 会 发 生 俘 顿 的 CMS 收集 器 中 ， 
枚 举 根 节点 时 也 是 必须 要 停顿 的 。 


项 


由 于 目前 的 主流 Java 虚 拟 机 使 用 的 都 是 准确 式 GC〈 这 个 概念 在 第 1 
章 介绍 Exact VM 对 Classic VM 的 改进 时 讲 过 ) ， 所 以 当 执 行 系统 停顿 下 
来 后 ， 并 不 需要 一 个 不 漏 地 检查 完 所 有 执行 上 下 文 和 全 局 的 引用 位 置 ， 
虚拟 机 应 当 是 有 办 法 直接 得 知 哪些 地 方 存放 着 对 象 引 用 。 在 HotSpot 的 
实现 中 ， 是 使 用 一 组 称 为 OopMap 的 数据 结构 来 达到 这 个 目的 的 ， 在 类 
加 载 完 成 的 时 候 ，HotSpot 就 把 对 象 内 什么 偏 移 量 上 是 什么 类 型 的 数据 
计算 出 来 ， 在 JIT 编 译 过 程 中 ， 也 会 在 特定 的 位 置 记录 下 栈 和 寄存 器 中 
哪些 位 置 是 引用 。 这 样 ，GC 在 扫描 时 就 可 以 直接 得 知 这 些 信息 了 。 下 
面 的 代码 清单 3-3 是 HotSpot Client VM 生 成 的 一 段 String.hashCode() 方 法 
的 本 地 代码 ， 可 以 看 到 在 0x026eb7a9 处 的 call 指 令 有 OopMap 记 录 ， 它 指 
明了 EBX 寄 存 器 和 栈 中 偏 移 量 为 16 的 内 存 区 域 中 各 有 一 个 普通 对 象 指 针 
(Ordinary Object Pointer) 的 引用 ， 有 效 范 围 为 从 call 指 令 开始 直到 
0x026eb730 (指令 流 的 起 始 位 置 ) +142 (OopMap 记 录 的 偏 移 量 ) 
=0x026eb7be， 即 hlt 指 令 为 止 。 











代码 清单 3-3 ”String.hashCode() 方 法 编译 后 的 本 地 代码 











[Verified Entry Point] 
0x026eb730 :movgseax，-0x8000 (Sesp) 





; ImplicitNullCheckSstub slow case 
Ox026eb7a9:call 0x026e83e0 

; OopMap {ebx=Oop[16]=Oop off=142} 

; *caload 

; -java.lang.String:hashCode@48 (line 1489) 
; {runtime call} 

Ox026eb7ae:push$0x83c5c18 

; {external word} 




















0x026eb7b3:call 0x026eb7b8 
0x026eb7b8:pusha 

Ox026eb7b9:call Ox0822bec0; {runtime calll} 
0x026eb7be:hilt 


二 一 














We 


在 OQopMap 的 协助 下 ，HotSpot 可 以 快速 且 准 确 地 完成 GC Roots 枚 
举 ， 但 一 个 很 现实 的 问题 随 之 而 来 : 可 能 导致 引用 关系 变化 ， 或 者 说 
OopMap 内 容 变 化 的 指令 非常 多 ， 如 果 为 每 一 条 指令 都 生成 对 应 的 
OopMap， 那 将 会 需要 大 量 的 额外 空间 ， 这 样 GC 的 空间 成 本 将 会 变 得 很 





[有 。 





实际 上 ，HotSpot 也 的 确 没 有 为 每 条 指令 都 生成 DopMap， 前 面 已 经 
提 到 ， 只 是 在 “特定 的 位 置 ?记录 了 这 些 信 息 ， 这 些 位 置 称 为 安全 点 
《Safepoint) ， 即 程序 执行 时 并 非 在 所 有 地 方 都 能 停顿 下 来 开始 GC， 
只 有 在 到 达 安 全 点 时 才能 暂停 。Safepoint 的 选 定 既 不 能 太 少 以 致 于 让 
GC 等 待 时 间 太 长 ， 也 不 能 过 于 频繁 以 致 于 过 分 增 大 运行 时 的 负荷 。 所 
以 ， 安 全 点 的 选 定 基本 上 是 以 程序 “是 否 具 有 让 程序 长 时 间 执 行 的 特 
征 ” 为 标准 进行 选 定 的 一 一 因为 每 条 指令 执行 的 时 间 都 非常 短暂 ， 程 序 
不 太 可 能 因为 指令 流 长 度 太 长 这 个 原因 而 过 长 时 间 运 行 , “长 时 间 执 
行 ” 的 最 明显 特征 就 是 指令 序列 复 用 ， 例 如 方法 调用 、 循 环 跳 转 、 异 常 
跳 转 等 ， 所 以 具有 这 些 功 能 的 指令 才 会 产生 Safepoint。 

















对 于 Safepoint， 男 一 个 需要 考虑 的 问题 是 如 何在 GC 发 生 时 让 所 有 
线程 (这 里 不 包括 执行 JNI 调 用 的 线程 》 都 “ 跑 ” 到 最 近 的 安全 点 上 再 停 


顿 下 来 。 这 里 有 两 种 方案 可 供 选 择 : 抢先 式 中 断 〈Preemptive 
Suspension) 和 主动 式 中 断 〈Voluntary Suspension) ， 其 中 抢先 式 中 断 
不 需要 线程 的 执行 代码 主动 去 配合 ， 在 GC 发 生 时 ， 首 先 把 所 有 线程 全 
部 中 断 ， 如 果 发 现 有 线程 中 断 的 地 方 不 在 安全 点 上 ， 就 恢复 线程 ， 让 
它 “ 跑 ”到 安全 点 上 。 现 在 几乎 没有 虚拟 机 实现 采用 抢先 式 中 断 来 暂停 线 
程 从 而 响应 GC 事件 。 








而 主动 式 中 断 的 思想 是 当 GC 需 要 中 断 线程 的 时 候 ， 不 直接 对 线程 
操作 ， 仅 仅 简单 地 设置 一 个 标志 ， 各 个 线程 执行 时 主动 去 轮 询 这 个 标 
志 ， 发 现 中 断 标 志 为 真 时 就 自己 中 断 挂 起 。 轮 询 标志 的 地 方 和 安全 点 是 
重合 的 ， 另 外 再 加 上 创建 对 象 需要 分 配 内 存 的 地 方 。 下 面 代码 清单 3-4 
中 的 test 指 令 是 HotSpot 生 成 的 轮 询 指令 ， 当 需要 和 暂停 线程 时 ， 虚 拟 机 把 
0x160100 的 内 存 页 设置 为 不 可 读 ， 线 程 执行 到 test 指 令 时 就 会 产生 一 个 
自 陷 异 常 信号 ， 在 预先 注册 的 异常 处 理 器 中 暂停 线程 实现 等 待 ， 这 样 一 
条 汇编 指令 便 完 成 安全 点 轮 询 和 触发 线程 中 断 。 














代码 清单 3-4 轮 询 指令 




















Ox01lb6d627:call Ox01b2b210; OopMap{[60]=Oop off=460} 
; *invokeinterface siz 

; -Clientl:main@113 (line 23) 

; {virtual call) 
0x01lb6d62c:nop 

; OopMap{[60]=Oop off=461} 
让 七 

; -Clientl:main@118 (line 23) 
Ox0lb6d62d:test%eax, Ox160100; {poll} 
0x01b6d633:mov 0x50 (Sesp) ， Sesi 






































0x01b6Qaqa637 :cmpgseax，S$5esi 


[EE | 


34.3 溉 全 区 域 


使 用 Safepoint 似 乎 已 经 完美 地 解决 了 如 何 进 入 GC 的 问题 ， 但 实际 
情况 却 并 不 一 定 。Safepoint 机 制 保证 了 程序 执行 时 ， 在 不 太 长 的 时 间 内 
就 会 遇 到 可 进入 GC 的 Safepoint。 但 是 ， 程 序 “ 不 执行 ”的 时 候 呢 ? 所 谓 的 
程序 不 执行 就 是 没有 分 配 CPU 时 间 ， 典 型 的 例子 就 是 线程 处 于 Sleep 状态 
或 者 Blocked 状 态 ， 这 时 候 线 程 无 法 响应 JVM 的 中 断 请 求 ,“ 走 ?到 安全 
的 地 方 去 中 断 挂 起 ，JVM 也 显然 不 太 可 能 等 待 线程 重新 被 分 配 CPU 时 
间 。 对 于 这 种 情况 ， 就 需要 安全 区 域 (Safe Region) 来 解决 。 














安全 区 域 是 指 在 一 段 代 码 片段 之 中 ， 引 用 关系 不 会 发 生变 化 。 在 这 
个 区 域 中 的 任意 地 方 开 始 GC 都 是 安全 的 。 我 们 也 可 以 把 Safe Region 看 
做 是 被 扩展 了 的 Safepoint。 





在 线程 执行 到 Safe Region 中 的 代码 时 ， 首 先 标 识 自己 已 经 进入 了 
Safe Region， 那 样 ， 当 在 这 段 时 间 里 JVM 要 发 起 GC 时 ， 就 不 用 管 标 识 
自己 为 Safe Region 状 态 的 线程 了 。 在 线程 要 离开 Safe Region 时 ， 它 要 检 
查 系统 是 否 已 经 完成 了 根 节点 枚 举 ( 或 者 是 整个 GC 过 程 》， 如 果 完 成 
了 ， 那 线程 就 继续 执行 ， 否 则 它 就 必须 等 待 直到 收 到 可 以 安全 离开 Safe 
Region 的 信号 为 止 。 


到 此 ， 笔 者 简要 地 介绍 了 HotSpot 虚 拟 机 如 何 去 发 起 内 存 回收 的 问 





题 ， 但 是 虚拟 机 如 何 具体 地 进行 内 存 回收 动作 仍然 未 涉及 ， 因 为 内 存 回 
收 如 何 进行 是 由 虚拟 机 所 采用 的 GC 收 集 器 决定 的 ， 而 通常 虚拟 机 中 往 
往 不 止 有 一 种 GC 收 集 器 。 下 面 继续 来 看 HotSpot 中 有 哪些 GC 收 集 器 。 


3.5 垃圾 收集 器 


如 果 说 收集 算法 是 内 存 回收 的 方法 论 ， 那 么 垃圾 收集 器 就 是 内 存 回 
收 的 具体 实现 。Java 虚 拟 机 规范 中 对 垃圾 收集 器 应 该 如 何 实现 并 没有 任 
何 规定 ， 因 此 不 同 的 厂商 、 不 同 版 本 的 虚拟 机 所 提供 的 垃圾 收集 器 都 可 
能 会 有 很 大 差别 ， 并 且 一 般 都 会 提供 参数 供用 户 根 据 自 己 的 应 用 特点 和 
要 求 组 合 出 各 个 年 代 所 使 用 的 收集 器 。 这 里 讨论 的 收集 器 基于 JDK 1.7 
Update 14 之 后 的 HotSpot 虚 拟 机 (在 这 个 版 本 中 正式 提供 了 商用 的 G1 收 
集 器 ， 之 前 G1 仍 处 于 实验 状态 ) ， 这 个 虚拟 机 包含 的 所 有 收集 器 如 图 3- 
5 所 示 。 








Young generation 


Parallel 
YY Scavenge 


Tenured generation 





图 3-5 HotSpot 虚 拟 机 的 垃圾 收集 器 中 





图 3-5 展 示 了 7 种 作用 于 不 同 分 代 的 收集 器 ， 如 果 两 个 收集 器 之 间 存 
在 连 线 ， 就 说 明 它 们 可 以 搭配 使 用 。 虚 拟 机 所 处 的 区 域 ， 则 表示 它 是 属 
于 新 生 代 收集 器 还 是 老年 代 收 集 器 。 接 下 来 笔者 将 逐一 介绍 这 些 收集 需 
的 特性 、 基 本 原理 和 使 用 场景 ， 并 重点 分 析 CMS 和 G1 这 两 蒜 相 对 复杂 
的 收集 器 ， 了 解 它 们 的 部 分 运作 细节 。 








在 介绍 这 些 收集 器 各 目的 特性 之 前 ， 我 们 先 来 明确 一 个 观点 : 虽然 
我 们 是 在 对 各 个 收集 器 进行 比较 ， 但 并 非 为 了 挑选 出 一 个 最 好 的 收集 


器 。 因 为 直到 现在 为 止 还 没有 最 好 的 收集 霹 出 现 ， 更 加 没有 万 能 的 收集 
器 ， 所 以 我 们 选择 的 只 是 对 具体 应 用 最 合适 的 收集 器 。 这 点 不 需要 多 加 
解释 就 能 证 明 : 如 果 有 一 种 放 之 四 海 缘 准 、 任 何 场 景 下 都 适用 的 完美 收 
集 恬 存在 ， 那 HotSpot 虚 拟 机 就 没 必 要 实现 那么 多 不 同 的 收集 妖 了 。 








3.5.1 Serial 收集 器 





Serial 收 集 器 是 最 基本 、 发 展 历史 最 悠久 的 收集 器 ， 曾 经 〈 在 JDK 
1.3.1 之 前 ) 是 虚拟 机 新 生 代 收集 的 唯一 选择 。 大 家 看 名 字 就 会 知道 ， 这 
个 收集 器 是 一 个 单线 程 的 收集 器 ， 但 它 的 “单线 程 * 的 意义 并 不 仅仅 说 明 
它 只 会 使 用 一 个 CPU 或 一 条 收集 线程 去 完成 垃圾 收集 工作 ， 更 重要 的 是 
在 它 进 行 垃圾 收集 时 ， 必 须 暂 停 其 他 所 有 的 工作 线程 ， 直 到 它 收 集结 
束 。"Stop The World" 这 个 名 字 也 许 听 起 来 很 酷 ， 但 这 项 工作 实际 上 是 
由 虚拟 机 在 后 台 自 动 发 起 和 自动 完成 的 ， 在 用 户 不 可 见 的 情况 下 把 用 户 
正常 工作 的 线程 全 部 停 掉 ， 这 对 很 多 应 用 来 说 都 是 难以 接受 的 。 读 者 不 
妨 试想 一 下 ， 要 是 你 的 计算 机 每 运行 一 个 小 时 就 会 暂停 啊 应 5 分 钟 ， 你 
会 有 什么 样 的 心情 ?图 3-6 示 意 了 Serial/Serial Old 收集 器 的 运行 过 程 。 








用 户 厂 程 
CPUD : 
时 GC 线程 GC 线程 
CPU 1 用 户 线 程 2 
用 户 总 程 3 采 ; 邯 本 :- 
CPU 2 新 生 代 采取 复制 算法 老年 代 采 了 标记 -区 理 算 法 


暂停 所 有 用 户 线程 暂停 所 有 用 户 线 程 
CPU3 用 己 冻 程 4 


Safepoint Safepoint 


图 3-6 Setial/Setial Old 收集 器 运行 示意 图 


ee 
示 完 全 理解 ， 但 也 表示 非常 委屈 :“ 你 妈妈 在 给 你 打扫 房间 的 时 候 ， 

会 让 你 老 老实 实地 在 椅子 上 或 者 房间 外 竺 着， 如 果 她 一 边 打 扫 ， 你 
一 边 乱 扔 纸 屑 ， 这 房间 还 能 打扫 完 ? ”这 确实 是 一 个 合情合理 的 矛盾 ， 
虽然 垃圾 收集 这 项 工作 听 起 来 和 打扫 房间 属于 一 个 性 质 的 ， 但 实际 上 表 

还 要 比 打扫 房间 复杂 得 多 啊 ! 














从 JDK 1.3 开 始 ， 一 直到 现在 最 新 的 JDK 1.7，HotSpot 虚 拟 机 开发 团 
队 为 消除 或 者 减少 工作 线程 因 内 存 回收 而 导致 停顿 的 努力 一 直 在 进行 
着 ， 从 Serial 收 集 器 到 Parallel 收 集 器 ， 再 到 Concurrent Mark 
Sweep (CMS ) 乃至 GC 收集 器 的 最 前 沿 成 果 Garbage First (G1) 收集 
器 ， 我 们 看 到 了 一 个 个 越 来 越 优 秀 〈 也 越 来 越 复杂 ) 的 收集 器 的 出 现 ， 
用 户 线程 的 停顿 时 间 在 不 断 缩短 ， 但 是 仍然 没有 办 法 完全 消除 〈 这 里 暂 
不 包括 RTSJ 中 的 收集 器 ) 。 寻 找 更 优秀 的 垃圾 收集 器 的 工作 仍 在 继 


续 ! 





写 到 这 里 ， 笔 者 似乎 已 经 把 Serial 收 集 占 描述 成 一 个 “ 老 而 无 用 、 食 
之 无 味 弃 之 可 惜 ” 的 鸡肋 了 ， 但 实际 上 到 现在 为 止 ， 它 依然 是 虚拟 机 运 
行 在 Client 模 式 下 的 默认 新 生 代 收 集 器 。 它 也 有 着 优 于 其 他 收集 右 的 地 
方 : 简单 而 局 效 ( 与 其 他 收集 右 的 单线 程 比 ) ， 对 于 限定 单个 CPU 的 环 
境 来 说 ，Serial 收 集 器 由 于 没有 线程 交互 的 开销 ， 专 心 做 垃圾 收集 目 然 








可 以 获得 最 高 的 单线 程 收集 效率 。 在 用 户 的 条 面 应 用 场景 中 ， 分 配给 虚 
拟 机 管理 的 内 存 一 般 来 说 不 会 很 大 ， 收 集 儿 十 兆 甚 至 一 两 百 兆 的 新 生 代 
仅仅 是 新 生 代 使 用 的 内 存 ， 果 面 应 用 基本 上 不 会 再 大 了 ) ， 停 顿时 间 
完全 可 以 控制 在 几 十 坚 秒 最 多 一 百 多 野 秒 以 内 ， 只 要 不 是 频繁 用 生 ， 这 
点 停顿 是 可 以 接受 的 。 所 以 ，Serial 收 集 器 对 于 运行 在 Client 模 式 下 的 虚 


拟 机 来 说 是 一 个 很 好 的 选择 。 








四 图 片 来 源 : http://blogs.sun.com/jonthecollector/entry/our_collectors。 


3.5.2 ”ParNew 收 集 器 


ParNew 收 集 器 其 实 就 是 Serial 收 集 器 的 多 线程 版 本 ， 除 了 使 用 多 条 
线程 进行 垃圾 收集 之 外 ， 其 余 行为 包括 Serial 收 集 器 可 用 的 所 有 控制 参 
数 ( 例 如 : -XX:SurvivorRatio、-XX:PretenureSizeThreshold、- 
XX:HandlePromotionFailure 等 ) 、 收 集 算 法 、Stop The World、 对 象 分 配 
规则 、 回 收 策略 等 都 与 Serial 收 集 器 完全 一 样 ， 在 实现 上 ， 这 两 种 收集 
器 也 共用 了 相当 多 的 代码 。ParNew 收 集 器 的 工作 过 程 如 图 3-7 所 示 。 





用 户 线程 1 
CPU 0 
CPU DZmi 老年 代 采 取 标 记 -可 各 算法 
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暂停 所 有 用 户 线程 
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图 3-7 ParNew/Serial Old 收集 器 运行 示意 图 


ParNew 收 集 器 除了 多 线程 收集 之 外 ， 其 他 与 Serial 收 集 器 相 比 并 没 
有 太 多 创新 之 处 ， 但 它 却 是 许多 运行 在 Server 模 式 下 的 虚拟 机 中 首选 的 
新 生 代 收集 器 ， 其 中 有 一 个 与 性 能 无 关 但 很 重要 的 原因 是 ， 除 了 Serial 
收集 器 外 ， 目 前 只 有 它 能 与 CMS 收集 器 配合 工作 。 在 JDK 1.5 时 期 ， 
HotSpot 推 出 了 一 蒜 在 强 交 互 应 用 中 几乎 可 认为 有 划时代 意义 的 垃圾 收 
集 器 一 -CMS 收集 器 (Concurrent Mark Sweep， 本 节 稍 后 将 详细 介绍 这 
款 收 集 器 ) ， 这 款 收 集 器 是 HotSpot 虚 拟 机 中 第 一 款 真 正 意义 上 的 并 发 














CConcurrent) 收集 器 ， 它 第 一 次 实现 了 让 垃圾 收集 线程 与 用 户 线程 
(基本 上 ) 同时 工作 ， 用 前 面 那 个 例子 的 话 来 说 ， 束 是 做 到 了 在 你 的 妈 
妈 打 扫 房 间 的 时 候 你 还 能 一 边 往 地 上 扔 纸 屑 。 


不 羊 的 是 ，CMS 作 为 老年 代 的 收集 器 ， 却 无 法 与 JDK 1.4.0 中 已 经 存 
在 的 新 生 代 收 集 器 Parallel Scavenge 配 合 工 作 上 由 1， 所 以 在 JDK 1.5 中 使 用 
CMS 来 收集 老年 代 的 时 候 ， 新 生 代 只 能 选择 ParNew 或 者 Serial 收 集 器 中 
的 一 个 。ParNew 收 集 器 也 是 使 用 -XX:+UseConcMarkSweepGC 选 项 后 的 
默认 新 生 代 收 集 器 ， 也 可 以 使 用 -XX:+UseParNewGC 选 项 来 强制 指定 


We 


巴 。 


ParNew 收 集 器 在 单 CPU 的 环境 中 绝对 不 会 有 比 Serial 收 集 器 更 好 的 
效果 ， 甚 至 由 于 存在 线程 交互 的 开销 ， 该 收集 器 在 通过 超 线程 技术 实现 
的 两 个 CPU 的 环境 中 都 不 能 百分之百 地 保证 可 以 超越 Serial 收 集 器 。 当 
然 ， 随 着 可 以 使 用 的 CPU 的 数量 的 增加 ， 它 对 于 GC 时 系统 资源 的 有 效 
利用 还 是 很 有 好 处 的 。 它 默认 开启 的 收集 线程 数 与 CPU 的 数量 相同 ， 在 
CPU 非常 多 〈 璧 如 32 个 ， 现 在 CPU 动 辑 就 4 核 加 超 线程 ， 服 务 器 超过 32 
个 逻辑 CPU 的 情况 越 来 越 多 了 ) 的 环境 下 ， 可 以 使 用 - 
XX:ParallelGCThreads 参 数 来 限制 垃圾 收集 的 线程 数 。 








注意 ”从 ParNew 收 集 喜 开始， 后 面 还 会 接触 到 几 亚 并 发 和 并 行 的 
收集 上 器。 在 大 家 可 能 产生 疑惑 之 前 ， 有 必要 先 解 释 两 个 名 词 : 并 发 和 并 
行 。 这 两 个 名 词 都 是 并 发 编程 中 的 概念 ， 在 谈论 坛 圾 收集 器 的 上 下 文 语 








境 中 ， 它 们 可 以 解释 如 下 。 
e 并 行 (Parallel) : 指 多 条 垃圾 收集 线程 并 行 工作 ， 但 此 时 用 户 线 


程 仍 然 处 于 等 待 状态 。 


e 并 及 (Concurrent) : 指 用 户 线程 与 垃圾 收集 线程 同时 执行 (但 不 


\ 一 /一 


一 定 是 并 行 的 ， 可 能 会 交 蔡 执行 )， 用 户 程 序 在 继续 运行 ， 而 垃圾 收集 
了 





[Parallel Scavenge 收 集 器 及 后 面 提 到 的 G1 收集 器 都 没有 使 用 传统 的 GC 
收集 器 代码 框架 ， 而 另外 独立 实现 ， 其 余 几 种 收集 器 则 共用 了 部 分 的 框 
架 代码 ， 详 细 内 容 可 参考 : 


http:/ /blogs.sun.com/jonthecollector/entry/our_collectors。 


3.5.3 ”Parallel Scavenge 收 集 右 


Parallel Scavenge 收 集 器 是 一 个 新 生 代 收集 器 ， 它 也 是 使 用 复制 算法 
的 收集 器 ， 又 是 并 行 的 多 线程 收集 器 ...... 看 上 去 和 ParNew 都 一 样 ， 那 
它 有 什么 特别 之 处 呢 ? 





ne 
CMS 等 收集 器 的 关注 点 是 尽 可 能 地 缩短 垃圾 收集 时 用 户 线程 的 停顿 时 
间 ， 而 Parallel Scavenge 收 集 器 的 目标 则 是 达到 一 个 可 控制 的 吞吐 量 
(Throughput) 。 所 谓 知 吐 量 就 是 CPU 用 于 运行 用 户 代码 的 时 间 与 CPU 
总 消耗 时 间 的 比值 ， 即 吞吐 量 = 运 行 用 户 代 码 时 间 /( 运 行 用 户 代码 时 间 
+ 垃圾 收集 时 间 ) ， 虚 拟 机 总 共 运 行 了 100 分 钟 ， 其 中 垃圾 收集 花 掉 1 分 
钟 ， 那 吞吐 量 就 是 99%。 











停顿 时 间 越 短 残 越 适 合 需 要 与 用 户 交 互 的 程序 ， 民 好 的 咽 应 速度 能 
提升 用 户 体验 ， 而 高 吞吐 量 则 可 以 高 效率 地 利用 CPU 时 间 ， 尽 快 完成 程 
序 的 运算 任务 ， 主 要 适合 在 后 台 运 算 而 不 需要 太 多 交互 的 任务 。 

















Parallel Scavenge 收 集 器 提供 了 两 个 参数 用 于 精确 控制 吞吐 量 ， 分 别 
是 控制 最 大 垃圾 收集 停顿 时 间 的 -XXX:MaxGCPauseMillis 参 数 以 及 直接 设 
置 吞吐 量 大 小 的 -XX:GCTimeRatio 参 数 。 


MaxGCPauseMillis 参 数 允 许 的 值 是 一 个 大 于 0 的 蝇 秒 数 ， 收 集 器 将 
尽 可 能 地 保证 内 存 回收 花费 的 时 间 不 超过 设 定 值 。 不 过 大 家 不 要 认为 如 
果 把 这 个 参数 的 值 设置 得 稍 小 一 点 就 能 使 得 系统 的 垃圾 收集 速度 变 得 更 
快 ，GC 停 顿时 间 缩短 是 以 牺牲 吞吐 量 和 新 生 代 空间 来 换取 的 : 系统 把 
新 生 代 调 小 一 些 ， 收 集 300MB 新 生 代 肯定 比 收集 500MB 快 吧 ， 这 也 直接 
导致 垃圾 收集 发 生得 更 频繁 一 些 ， 原 来 10 秒 收集 一 次 、 每 次 停顿 100 宫 
秒 ， 现 在 变 成 5 秒 收集 一 次 、 每 次 停顿 70 宫 秒 。 停 顿时 间 的 确 在 下 降 ， 
但 吞吐 量 也 降下 来 了 。 

















GCTimeRatio 参 数 的 值 应 当 是 一 个 大 于 0 且 小 于 100 的 整数 ， 也 就 是 
垃圾 收集 时 间 占 总 时 间 的 比率 ， 相 当 于 是 吞吐 量 的 倒数 。 如 果 把 此 参数 
设置 为 19， 那 允许 的 最 大 GC 时 间 就 占 总 时 间 的 59%《〈 即 1 〈1+19) ) ， 
默认 值 为 99， 就 是 允许 最 大 19% 〈 即 1 〈1+99) ) 的 垃圾 收集 时 间 。 





由 于 与 吞吐 量 关 系 密 切 ，Parallel Scavenge 收 集 器 也 经 常 称 为 “吞吐 
量 优先 ?收集 器 。 除 上 述 两 个 参数 之 外 ，Parallel Scavenge 收 集 器 还 有 一 
个 参数 -XX:+UseAdaptiveSizePolicy 值 得 关注 。 这 是 一 个 开关 参数 ， 当 这 
个 参数 打开 之 后 ， 就 不 需要 手工 指定 新 生 代 的 大 小 〈-Xmn) 、Eden 与 
Survivor 区 的 比例 〈-XX:SurvivorRatio) 、 晋 升 老年 代 对 象 年 龄 〈- 
XX:PretenureSizeThreshold) 等 细节 参数 了 ， 虚 拟 机 会 根据 当前 系统 的 
运行 情况 收集 性 能 监控 信息 ， 动 态 调整 这 些 参 数 以 提供 最 合适 的 停顿 时 


间或 者 最 大 的 吞吐 量 ， 这 种 调节 方式 称 为 GC 目 适应 的 调节 策略 (GC 








Ergonomics) 由。 如 果 读 者 对 于 收集 器 运作 原来 不 太 了 解 ， 手 工 优 化 存 
在 困难 的 时 候 ， 使 用 Parallel Scavenge 收 集 器 配合 自 适 应 调节 策略 ， 把 内 
存 管理 的 调 优 任务 交 给 虚拟 机 去 完成 将 是 一 个 不 错 的 选择 。 只 需要 把 基 
本 的 内 存 数据 设置 好 (如 -Xmx 设 置 最 大 堆 ) ， 然 后 使 用 
MaxGCPauseMillis 参 数 (更 关注 最 大 停顿 时 间 ) 或 GCTimeRatio 〈 更 关 
注 吞 吐 量 ) 参数 给 虚拟 机 设立 一 个 优化 目标 ， 那 具体 细节 参数 的 调节 工 
作 就 由 虚拟 机 完成 了 。 目 适应 调节 策略 也 是 Parallel Scavenge 收 集 器 与 
ParNew 收 集 器 的 一 个 重要 区 别 。 





[1 官方 介绍 : http://download.oracle.com/javase/1.5.0/docs/guide/vm/gc- 


ergonomics.html。 


3.5.4 ”Serial Old 收集 器 





Serial Old 是 Serial 收 集 右 的 老年 代 版 本 ， 它 同样 是 一 个 单线 程 收 集 
器 ， 使 用 “标记 -整理 ”算法 。 这 个 收集 器 的 主要 意义 也 是 在 于 给 Client 模 
式 下 的 虚拟 机 使 用 。 如 果 在 Server 模 式 下 ， 那 么 它 主要 还 有 两 大 用 途 
一 种 用 途 ER 
使 用 趾 ， 另 一 种 用 途 就 是 作为 CMS 收 集 器 的 后 备 预案 ， 在 并 发 收集 发 生 
Concurrent Mode Failure 时 使 用 。 这 两 点 都 将 在 后 面 的 内 容 中 详细 讲解 。 
Serial Old 收 集 器 的 工作 过 程 如 图 3-8 所 示 。 





用 户 线 程 1 
CPU 0 
CPU 1 一 -用户 线程 2 
CPU 2 用 Ps 程 3 新 生 代 采取 复制 算法 老年 代 采 取 标 记 - 整 理 算法 
用 户 维 租 4 暂停 所 有 用 户 线程 暂停 所 有 用 户 钱 程 
CPU3 


Safepoint Safepoint 


图 3-8 ”Serial/Serial Old 收集 器 运行 示意 图 
四 需要 说 明 一 下 ，Patallel Scavenge 收 集 器 架构 中 本 身 有 PS MatkSweep 收 
集 器 来 进行 老年 代 收 集 ， 并 非 直接 使 用 了 Setial Old 收集 器 ， 但 是 这 个 PS 
MarkSweep 收 集 器 与 Serial Old 的 实现 非常 接近 ， 所 以 在 官方 的 许多 资料 
中 都 是 直接 以 Setial Old 代替 PS MatkSweep 进 行 讲解 ， 这 里 笔者 也 采用 这 
种 方式 。 


3.5.5“ Parallel Old 收集 器 


Parallel Old 是 Parallel Scavenge 收 集 占 的 老年 代 版 本 ， 使 用 多 线程 
和 “标记 -整理 ”算法 。 这 个 收集 器 是 在 JDK 1.6 中 才 开 始 提供 的 ， 在 此 之 
前 ， 新 生 代 的 Parallel Scavenge 收 集 器 一 直 处 于 比较 尴 罚 的 状态 。 原 因 
是 ， 如 果 新 生 代 选择 了 Parallel Scavenge 收 集 器 ， 老 年 代 除了 Serial 
Old (PS MarkSweep) 收集 器 外 别 无 选择 (还 记得 上 面 说 过 Parallel 
Scavenge 收 集 器 无 法 与 CMS 收集 器 配合 工作 吗 ? ) 。 由 于 老年 代 Serial 
Old 收集 器 在 服务 端 应 用 性 能 上 的 “拖累 *， 使 用 了 Parallel Scavenge 收 集 
器 也 未 必 能 在 整体 应 用 上 获得 吞吐 量 最 大 化 的 效果 ， 由 于 单线 程 的 老年 
代 收 集中 无 法 充分 利用 服务 器 多 CPU 的 处 理 能 力 ， 在 老年 代 很 大 而 且 硬 
件 比 较 高 级 的 环境 中 ， 这 种 组 合 的 吞吐 量 甚至 还 不 一 定 有 ParNew 加 
CMS 的 组 合 “ 给 力 ”。 














直到 Parallel Old 收集 器 出 现 后 , “吞吐 量 优先 ?收集 器 终于 有 了 比较 
名 副 其 实 的 应 用 组 合 ， 在 注重 吞吐 量 以 及 CPU 资源 敏感 的 场合 ， 都 可 以 
优先 考虑 Parallel Scavenge 加 Parallel Old 收集 器 。Parallel Old 收 集 器 的 工 
作 过 程 如 图 3-9 所 示 。 





CPU 0 
CPU 1 
CPU 2 
CPU 3 


用 户 线 程 1 


用 己 线 程 2 全 
用 尸 线 程 3 时 
用 户 线 程 4 旺 


Safepoint Safepoint 


图 3-9 ”Parallel Scavenge/Patallel Old 收集 


3.5.6 ”CMS 收集 器 


CMS (Concurrent Mark Sweep ) 收集 右 是 一 种 以 获取 最 短 回 收 停顿 
时 间 为 目标 的 收集 器 。 目 前 很 大 一 部 分 的 Java 应 用 集中 在 互联 网 站 或 者 
B/S 系统 的 服务 端 上 ， 这 类 应 用 尤其 重视 服务 的 响应 速度 ， 项 望 系统 集 
顿时 间 最 短 ， 以 给 用 户 帝 来 较 好 的 体验 。CMS 收 集 器 就 非常 符合 这 类 应 
用 的 需求 。 


从 名 字 〈 和 包含"Mark Sweep") 上 就 可 以 看 出 ，CMS 收 集 堪 是 基 
于 “标记 一 清除 ”算法 实现 的 ， 它 的 运作 过 程 相对 于 前 面 几 种 收集 器 来 说 








初始 标记 (CMS initial mark ) 

并 发 标记 (CMS concurrent mark ) 
重新 标记 (CMS remark) 

并 发 清除 (CMS concurrent sweep) 


其 中 ， 初 始 标 记 、 重 新 标记 这 两 个 步骤 仍然 需要 "Stop The 
World'"。 初 始 标记 仅仅 只 是 标记 一 下 GC Roots 能 直接 关联 到 的 对 象 ， 速 
度 很 快 ， 并 发 标记 阶段 就 是 进行 GC RootsTracing 的 过 程 ， 而 重新 标记 阶 











段 则 是 为 了 修正 并 发 标记 期 间 因 用 户 程序 继续 运作 而 导致 标记 产生 变动 
的 那 一 部 分 对 象 的 标记 记录 ， 这 个 阶段 的 停顿 时 间 一 般 会 比 初始 标记 阶 
段 稍 长 一 些 ， 但 远 比 并 发 标记 的 时 间 短 。 





由 于 整个 过 程 中 耗 时 最 长 的 并 发 标记 和 并 发 清除 过 程 收 集 器 线程 都 
可 以 与 用 户 线程 一 起 工作 ， 所 以 ， 从 忆 体 上 来 说 ，CMS 收 集 右 的 内 存 回 
收 过 程 是 与 用 户 线 程 一 起 并 发 执行 的 。 通 过 疼 3-10 可 以 比较 清楚 地 看 到 
CMS 收集 大 的 运作 步骤 中 并 发 和 需要 停顿 的 时 间 。 





CPU0 用 户 线程 1 用 户 线 程 1 用 户 线 程 1 用 户 线程 1 

CPU 1 用 户 线程 2 i 用 户 线程 2 用 户 线 程 2 用 户 线 程 2 

CPU 2 用 户 线程 3 

CPU3 用 户 线 程 4 用 户 线 程 4 用 户 线 程 4 用 户 线 程 3 
Safepoint Safepoint t fepoint 








CMS 是 一 款 优 秀 的 收集 器 ， 它 的 主要 优点 在 名 字 上 已 经 体现 出 来 
了 : 并 发 收集 、 低 停顿 ，Sun 公 司 的 一 些 官方 文档 中 也 称 之 为 并 发 低 停 
顿 收集 器 〈Concurrent Low Pause Collector) 。 但 是 CMS 还 远 达 不 到 完 
美的 程度 ， 它 有 以 下 3 个 明显 的 缺点 : 





CMS 收集 器 对 CPU 资源 非常 敏感 。 其 实 ， 面 向 并 发 设计 的 程序 都 对 
CPU 资源 比较 敏感 。 在 并 发 阶段 ， 它 虽然 不 会 导致 用 户 线 程 停顿 ， 但 是 
会 因为 占用 了 一 部 分 线程 〈 或 者 说 CPU 资源 ) 而 导致 应 用 程序 变 慢 ， 总 
否 吐 量 会 降低 。CMS 上 默认 局 动 的 回收 线程 数 是 (CPU 数量 +3) /4， 也 惑 


是 当 CPU 在 4 个 以 上 时 ， 并 发 回收 时 垃圾 收集 线程 不 少 于 25% 的 CPU 资 
源 ， 并 且 随 着 CPU 数量 的 增加 而 下 降 。 但 是 当 CPU 不 足 4 个 《譬如 2 个 ) 
时 ，CMS 对 用 户 程 序 的 影响 就 可 能 变 得 很 大 ， 如 果 本 来 CPU 负载 就 比较 
大 ， 还 分 出 一 半 的 运算 能 力 去 执行 收集 器 线程 ， 就 可 能 导致 用 户 程序 的 
执行 速度 忽然 降低 了 50%， 其 实 也 让 人 无 法 接受 。 为 了 应 付 这 种 情况 ， 
虚拟 机 提供 了 一 种 称 为 “ 增 量 式 并 发 收集 器 ” (Incremental Concurrent 
Mark Sweep/i-CMS) 的 CMS 收集 器 变种 ， 所 做 的 事情 和 单 CPU 人 年 代 PC 
机 操作 系统 使 用 抢占 式 来 模拟 多 任务 机 制 的 思想 一 样 ， 就 是 在 并 发 标 
记 、 清 理 的 时 候 让 GC 线程 、 用 户 线程 交 蔡 运行 ， 尽 量 减少 GC 线程 的 独 
占 资源 的 时 间 ， 这 样 整个 垃圾 收集 的 过 程 会 更 长 ， 但 对 用 户 程 序 的 影响 
就 会 显得 少 一 些 ， 也 就 是 速度 下 降 没 有 那么 明显 。 实 践 证 明 ， 增 量 时 的 
CMS 收 集 占 效果 很 一 般 ， 在 目前 版 本 中 ，i-CMS 已 经 被 声明 

为 "deprecated"， 即 不 再 提倡 用 户 使 用 。 























CMS 收 集 器 无 法 处 理 浮动 垃圾 (Floating Garbage) ， 可 能 

现 "Concurrent Mode Failure" 失 败 而 导致 男 一 次 Full GC 的 产生 。 由 于 

CMS 并 发 清理 阶段 用 户 线 程 还 在 运行 着 ， 伴 随 程序 运行 自然 就 还 会 有 新 
的 垃圾 不 断 产 生 ， 这 一 部 分 垃圾 出 现在 标记 过 程 之 后 ，CMS 无 法 在 当 次 
收集 中 人 处理 掉 它们 ， 只 好 留待 下 一 次 GC 时 再 清理 掉 。 这 一 部 分 垃圾 就 
称 为 “浮动 垃圾 *。 也 是 由 于 在 垃圾 收集 阶段 用 户 线 程 还 需要 运行 ， 那 也 
就 还 需要 预 留 有 足够 的 内 存 空间 给 用 户 线程 使 用 ， 因 此 CMS 收 集 器 不 能 
像 其 他 收集 器 那样 等 到 老年 代 几 乎 完全 被 填 满 了 再 进行 收集 ， 需 要 预 留 











一 部 分 空间 提供 并 发 收集 时 的 程序 运作 使 用 。 在 JDK 1.5 的 默认 设置 
下 ，CMS 收 集 器 当 老 年 代 使 用 了 68% 的 空间 后 就 会 被 激活 ， 这 是 一 个 偏 
保守 的 设置 ， 如 果 在 应 用 中 老年 代 增 长 不 是 太 快 ， 可 以 适当 调 高 参数 - 
XX:CMSInitiatingOccupancyFraction 的 值 来 提高 触发 百分比 ， 以 便 降低 
内 存 回收 次 数 从 而 获取 更 好 的 性 能 ， 在 JDK 1.6 中 ，CMS 收 集 器 的 启动 
闵 值 已 经 提升 至 92%。 要 是 CMS 运 行 期 间 预 留 的 内 存 无 法 满足 程序 需 
要 ， 就 会 出 现 一 次 "Concurrent Mode Failure" 失 败 ， 这 时 虚拟 机 将 启动 后 
备 预案 : 临时 启用 Serial Old 收集 器 来 重新 进行 老年 代 的 垃圾 收集 ， 这 样 
停顿 时 间 就 很 长 了 。 所 以 说 参数 -XX:CM SInitiatingOccupancyFraction 设 
置 得 太 高 很 容易 导致 大 量 "Concurrent Mode Failure" 失 败 ， 性 能 反而 降 
人 








还 有 最 后 一 个 缺点 ， 在 本 节 开头 说 过 ，CMS 是 一 款 基 于 “标记 一 清 
除 ” 算 法 实现 的 收集 器 ， 如 果 读 者 对 前 面 这 种 算法 介绍 还 有 印象 的 话 ， 
就 可 能 想到 这 意味 着 收集 结束 时 会 有 大 量 空间 碎片 产生 。 空 间 碎 片 过 多 
时 ， 将 会 给 大 对 象 分 配 剖 来 很 大 麻烦 ， 往 往 会 出 现 老 年 代 还 有 很 大 空间 
剩余 ， 但 是 无 法 找到 足够 大 的 连续 空间 来 分 配 当前 对 象 ， 不 得 不 提前 触 
发 一 次 Ful GC。 为 了 解决 这 个 问题 ，CMS 收 集 器 提供 了 一 个 - 
XX:+UseCMSCompactAtFullCollection 开 关 参 数 〈 默 认 就 是 开启 的 ) ， 

用 于 在 CMS 收集 器 顶 不 住 要 进行 FullGC 时 开启 内 存 碎片 的 合并 整理 过 
程 ， 内 存 整 理 的 过 程 是 无 法 并 发 的 ， 空 间 碎片 问题 没有 了， 但 停顿 时 间 
不 得 不 变 长 。 虚 拟 机 设计 者 还 提供 了 另外 一 个 参数 - 














XX:CMSFullGCsBeforeCompaction， 这 个 参数 是 用 于 设置 执行 多 少 次 不 
压缩 的 Full GC 后 ， 跟 着 来 一 次 带 压缩 的 (默认 值 为 0， 表 示 每 次 进入 
Full GC 时 都 进行 碎片 整 理 ) 。 





3.5.7 ”G1 收集 器 





G1 (Garbage-First〉 收 集 器 是 当今 收集 器 拉 术 发 展 的 最 前 沿 成 果 之 
一 ， 早 在 JDK 1.7 刚 刚 确 立项 目 目 标 ，Sun 公 司 给 出 的 JDK 1.7 RoadMap 
里 面 ， 它 就 被 视 为 JDK 1.7 中 HotSpot 虚 拟 机 的 一 个 重要 进化 特征 。 从 
JDK 6u14 中 开始 束 有 Early Access 版 本 的 G1 收集 器 供 开 发 人 员 实 验 、 试 
用 ， 由 此 开始 G1 收集 器 的 "Experimental" 状 态 持 续 了 数 年 时 间 ， 直 至 
JDK 7u4，Sun 公 司 才 认 为 它 达到 足够 成 熟 的 商用 程度 ， 移 除 


了 "Experimental" 的 标识 。 


G1 是 一 球面 回 服务 端 应 用 的 垃圾 收集 占 。HotSpot 开 友 团 队 赋 予 它 
的 使 命 是 (在 比较 长 期 的 ) 未 来 可 以 丛 换 挥 JDK 1.5 中 发 布 的 CMS 收 集 
人 虱 。 与 其 他 GC 收集 器 相 比 ，G1 具 备 如 下 特点 。 


并 行 与 并 发 :G1 能 充分 利用 多 CPU、 多 核 环境 下 的 硬件 优势 ， 使 用 
多 个 CPU (CPU 或 者 CPU 核 心 ) 来 缩短 Stop-The-World 停 顿 的 时 间 ， 部 
分 其 他 收集 器 原本 需要 停顿 Java 线 程 执 行 的 GC 动作 ，G1 收 集 器 仍然 可 
以 通过 并 发 的 方式 让 Java 程 序 继续 执行 。 





分 代 收 集 : 与 其 他 收集 占 一 样 ， 分 代 概 念 在 G1 中 依然 得 以 保留 。 
里 然 G1 可 以 不 需要 其 他 收集 器 配合 就 能 独立 管理 整个 GC 堆 ， 但 它 能 够 
采用 不 同 的 方式 去 处 理 新 创建 的 对 象 和 已 经 存活 了 一 段 时 间 、 效 过 多 次 


GC 的 旧 对 象 以 获取 更 好 的 收集 效果 。 


空间 整合 ， 与 CMS 的 “标记 一 清理 ”算法 不 同 ，G1 从 整体 来 看 是 基 
于 “标记 一 整理 ”算法 实现 的 收集 器 ， 从 局 部 《两 个 Region 之 间 ) 上 来 看 
是 基于 “复制 ”算法 实现 的 ， 但 无 论 如 何 ， 这 两 种 算法 都 意味 着 G1 运作 期 
间 不 会 产生 内 存 空间 雁 片 ， 收 集 后 能 提供 规整 的 可 用 和 内存。 这 种 特性 有 
利于 程序 长 时 间 运 行 ， 分 配 大 对 象 时 不 会 因为 无 法 找到 连续 内 存 空间 而 
提前 触及 下 一 次 GC。 








可 预测 的 停顿 ， 这 是 G1 相对 于 CMS 的 男 一 大 优势 ， 降 低 停顿 时 间 
是 G1 和 CMS 共同 的 关注 点 ， 但 G1 除 了 追求 低 停顿 外 ， 还 能 建立 可 预测 
的 停顿 时 间 模 型 ， 能 让 使 用 者 明确 指定 在 一 个 长 度 为 M 毫 秒 的 时 间 片 段 
内 ， 消 耗 在 垃圾 收集 上 的 时 间 不 得 超过 N 坚 秒 ， 这 几乎 已 经 是 实时 
Java (RTSJ) 的 垃圾 收集 器 的 特征 了 。 


在 G1 之 前 的 其 他 收集 器 进行 收集 的 范围 者 是 整个 新 生 代 或 者 老年 
代 ， 而 G1 不 再 是 这 样 。 使 用 G1 收 集 需 时 ，Java 推 的 内 存 布局 就 与 其 他 
收集 器 有 很 大 差别 ， 它 将 整个 Java 扒 划分 为 多 个 大 小 相等 的 独立 区 域 
CRegion) ， 虽 然 还 保留 有 新 生 代 和 老年 代 的 概念 ， 但 新 生 代 和 老年 代 
不 再 是 物理 隔离 的 了 ， 它 们 部 是 一 部 分 Region 〈 不 再 要 连续 ) 的 集合 。 





G1 收集 右 之 所 以 能 建 并 可 预测 的 停顿 时 间 模 型 ， 是 因为 它 可 以 有 
计划 地 避免 在 整个 Java 堆 中 进行 全 区 域 的 垃圾 收集 。G1 跟 踪 各 个 Region 


里 面 的 垃圾 堆积 的 价值 大 小 (回收 所 获得 的 空间 大 小 以 及 回收 所 需 时 间 
的 经 验 值 ) ， 在 后 全 维护 一 个 优先 列表 ， 每 次 根据 允许 的 收集 时 间 ， 优 
先 回收 价值 最 大 的 Region〈 这 也 就 是 Garbage-First 名 称 的 来 由 )〉 。 这 种 
使 用 Region 划 分 内 存 空间 以 及 有 优先 级 的 区 域 回 收 方式 ， 保 证 了 G1 收集 
器 在 有 限 的 时 间 内 可 以 获取 尽 可 能 高 的 收集 效率 。 








G1 把 内 存 “ 化 整 为 零 ” 的 思路 ， 理 解 起 来 似乎 很 容易 ， 但 其 中 的 实现 
细 贡 却 远 远 没有 想象 中 那样 简单 ， 人 否则 也 不 会 从 2004 年 Sun 实 验 室友 表 
第 一 篇 G1 的 论文 开始 直到 今天 《〈 将 近 10 年 时 间 ) 才 开 发 出 GI 的 商用 
版 。 笔 者 以 一 个 细节 为 例 ， 把 Java 堆 分 为 多 个 Region 后 ， 垃 圾 收集 是 否 
就 真 的 能 以 Region 为 单位 进行 了 ? 听 起 来 顺理成章 ， 再 仔细 想 想 就 很 容 
易 发 现 问题 所 在 : Region 不 可 能 是 孤立 的 。 一 个 对 象 分 配 在 某 个 Region 
中 ， 它 并 非 只 能 被 本 Region 中 的 其 他 对 象 引 用 ， 而 是 可 以 与 整个 Java 堆 
任意 的 对 象 发 生 引 用 关系 。 那 在 做 可 达 性 判定 确定 对 象 是 否 存活 的 时 
候 ， 岂 不 是 还 得 扫描 整个 Java 推 才能 保证 准确 性 ? 这 个 问题 其 实 并 非 在 
G1 中 才 有 ， 只 是 在 G1 中 更 加 突出 而 已 。 在 以 前 的 分 代 收 集中 ， 新 生 代 
的 规模 一 般 都 比 老年 代 要 小 许多 ， 新 生 代 的 收集 也 比 老年 代 要 频繁 许 
多 ， 那 回收 新 生 代 中 的 对 象 时 也 面临 相同 的 问题 ， 如 果 回 收 新 生 代 时 也 
不 得 不 同时 扫描 老年 代 的 话 ， 那 么 Minor GC 的 效率 可 能 下 降 不 少 。 














在 G1 收集 占 中 ，Region 之 间 的 对 象 引用 以 及 其 他 收集 右 中 的 新 生 代 
与 老年 代 之 间 的 对 象 引 用 ， 虚 拟 机 都 是 使 用 Remembered Set 来 避免 全 堆 


扫描 的 。G1 中 每 个 Region 都 有 一 个 与 之 对 应 的 Remembered Set， 虚 拟 机 
发 现 程 序 在 对 Reference 类 型 的 数据 进行 写 操作 时 ， 会 产生 一 个 Write 
Barrier 暂 时 中 断 写 操作 ， 检 查 Reference 引 用 的 对 象 是 否 处 于 不 同 的 
Region 之 中 《在 分 代 的 例子 中 就 是 检查 是 否 老年 代 中 的 对 象 引用 了 新 生 
代 中 的 对 象 ) ， 如 果 是 ， 便 通过 CardTable 把 相关 引用 信息 记录 到 被 引 
用 对 象 所 属 的 Region 的 Remembered Set 之 中 。 当 进行 内 存 回 收 时 ， 在 GC 
根 节点 的 枚 举 范 围 中 加 入 Remembered Set 即 可 保证 不 对 全 堆 扫 描 也 不 会 














如 果 不 计算 维护 Remembered Set 的 操作 ，G1 收 集 器 的 运作 大 人 致 可 划 
分 为 以 下 几 个 步骤 : 


初始 标记 〈Initial Marking ) 

并 发 标记 〈Concurrent Marking ) 

最 终 标 记 (Final Marking ) 

饶 选 回收 〈Live Data Counting and Evacuation) 


对 CMS 收集 器 运作 过 程 熟 悉 的 读者 ， 一 定 已 经 发 现 G1 的 前 几 个 步 
又 的 运作 过 程 和 CMS 有 很 多 相似 之 处 。 初 始 标记 阶段 仅仅 只 是 标记 一 下 
GC Roots 能 直接 关联 到 的 对 象 ， 并 且 修 改 TAMS (Next Top at Mark 
Start) 的 值 ， 让 下 一 阶段 用 户 程序 并 发 运行 时 ， 能 在 正确 可 用 的 Region 





中 创建 新 对 象 ， 这 阶段 需要 停顿 线程 ， 但 耗 时 很 得。 并 发 标记 阶段 是 从 
GC Root 开始 对 堆 中 对 象 进行 可 达 性 分 析 ， 找 出 存活 的 对 象 ， 这 阶段 耗 
时 较 长 ， 但 可 与 用 户 程序 并 发 执行 。 而 最 终 标记 阶段 则 是 为 了 修正 在 并 
发 标记 期 间 因 用 户 程 序 继续 运作 而 导致 标记 产生 变动 的 那 一 部 分 标记 记 
录 ， 虚 拟 机 将 这 段 时 间 对 象 变化 记录 在 线程 Remembered Set Logs 里 面 ， 
最 终 标记 阶段 需要 把 Remembered Set Logs 的 数据 合并 到 Remembered Set 
中 ， 这 阶段 需要 停顿 线程 ， 但 是 可 并 行 执行 。 最 后 在 得 选 回 收 阶段 首先 
对 各 个 Region 的 回收 价值 和 成 本 进行 排序 ， 根 据 用户 所 期 望 的 GC 停顿 
时 间 来 制定 回收 计划 ， 从 Sun 公 司 透 露出 来 的 信息 来 看 ， 这 个 阶段 其 实 
也 可 以 做 到 与 用 户 程序 一 起 并 发 执行 ， 但 是 因为 只 回收 一 部 分 Region， 
时 间 是 用 户 可 控制 的 ， 而 且 停顿 用 户 线程 将 大 幅 提高 收集 效率 。 通 过 图 
3-11 可 以 比较 清楚 地 看 到 G1 收集 器 的 运作 步 又 中 并 发 和 需要 停顿 的 阶 
段 。 


























CPUD 用 户 线 程 1 用 户 线程 1 用 尸 线 程 1 
CPU 1 用 户 线程 2 i 用 户 线程 2 用 中 线程 2 
CPU 2 用 户 线程 3 用 户 诚 程 3 
CPU 3 用 户 线程 4 用 户 线程 4 用 尸 线程 4 





Safepoint Safepoint Safepoint Safepoint 


图 3-11 G1 收集 器 运行 示意 图 


由 于 目前 G1 成 熟 版 本 的 发 布 时 间 还 很 短 ，G1 收 集 器 几乎 可 以 说 还 
没有 经 过 实际 应 用 的 考验 ， 网 络 上 关于 G1 收集 器 的 性 能 测试 也 非常 贫 


乏 ， 到 目前 为 止 ， 笔 者 还 没有 搜索 到 有 关 的 生产 环境 下 的 性 能 测试 报 
告 。 强 调 “ 生 产 环 境 下 的 测试 报告 ”是 因为 对 于 垃圾 收集 器 来 说 ， 仅 仅 通 
过 简单 的 Java 代 码 写 个 Microbenchmark 程 序 来 创建 、 移 除 Java 对 象 ， 再 
用 -XX:+PrintGCDetails 等 参数 来 查看 GC 日 志 是 很 难 做 到 准确 衡量 其 性 能 
的 。 因 此 ， 关 于 G1 收集 器 的 性 能 部 分 ， 笔 者 引用 了 Sun 实 验 室 的 论文 
《Garbage-First Garbage Collection》 中 的 一 段 测试 数据 。 








Sun 给 出 的 Benchmark 的 执行 硬件 为 Sun V880 服 务 器 (8x750MHz 
UltraSPARC III CPU、32G 内 存 、Solaris 10 操 作 系 统 ) 。 执 行 软件 有 两 
个 ， 分 别 为 SPECjbb《〈 模 拟 商业 数据 库 应 用 ， 扒 中 存活 对 象 约 为 
165MB， 结 果 反 映 吐 量 和 最 长 事务 处 理 时 间 ) 和 telco〈 模 拟 电话 应 答 服 
务 应 用 ， 堆 中 存活 对 象 约 为 100MB， 结 果 反 映 系统 能 支持 的 最 大 吞吐 
量 ) 。 为 了 便于 对 比 ， 还 收集 了 一 组 使 用 ParNew+CMS 收 集 器 的 测试 数 
据 。 所 有 测试 都 配置 为 与 CPU 数 量 相 同 的 8 条 GC 线程 。 








在 反应 停顿 时 间 的 软 实时 目标 〈Soft Real-Time Goal) 测试 中 ， 横 
向 是 两 个 测试 软件 的 时 间 片 段 配置 ， 单 位 是 毫秒 ， 以 〈X/Y) 的 形式 表 
示 ， 代 表 在 Y 毫 秒 内 最 大 允许 GC 时 间 为 X 坚 秒 〈 对 于 CMS 收集 器 ， 无 法 
直接 指定 这 个 目标 ， 通 过 调整 分 代 大 小 的 方式 大 致 模拟 ) 。 纵 向 是 两 个 
软件 在 对 应 配置 和 不 同 的 Java 堆 容量 下 的 测试 结果 ，V%、avgV% 和 和 
wV% 分 别 代表 的 含义 如 下 。 


V%: 表示 测试 过 程 中 ， 软 实时 目标 失败 的 概率 ， 软 实时 目标 失败 


即 某 个 时 间 卢 段 中 实际 GC 时 间 超 过 了 人 允许 的 最 大 GC 时 间 。 





avgV9%: 表示 在 所 有 实际 GC 时 间 超 标的 时 间 片 段 里 ， 实 际 GC 时 间 
超过 最 大 GC 时 间 的 平均 百分比 (实际 GC 时 间 减 去 允许 最 大 GC 时 间 ， 再 
除 以 总 时 间 片 段 〉。 


wV9%: 表示 在 测试 结果 最 差 的 时 间 片 段 里 ， 实 际 GC 时 间 占 用 执行 
时 间 的 百分比 。 


测试 结果 见 表 3-1。 


表 3-1 测试 结果 






Benchmark/ Soft real-time goal compliance statistics by Heap Size 
configuration | V% |avev% avgvV% | wy% avev% | wy% 
SPECjbb 512M 640M 768M 











( ] 00/200) 4.29% 36.40% 1 00.00% 1 .08% 1 0.94% 69.67% 


GI (150/300) 6| 5.95% .01% | 20.80%| 1.78%| 3.38%| 8.96% 











GI (150/450) 0 4.40% 4.32% .14% 2.34% 0| 1.53% 3.28% 

GI (150/600)| % | 2.90% 5.38% | 3.66% 2.45% 人 no| 2.54% 8.65% 

GI (200/300) 0.00% 0.00% | 0.00% 0.00% 

CMS (150/450) 23.93% | 82.14% | 100.00% 5.72% | 28.19% | 100.00% 
Telco 384M 640M 





Gl (50/100) | 8.92%| 35.48% | 0.16%|[ 909% 和 | 0.11% | 12.10%| 38.57% 
GI (75/150) 6| 11.90% | 19.99% | 0.08%| 5.60% 和 3.81%| 9.15% 
GI | 2.90% 3.31% 6 1.04% | 2.07% 
GI (75/300) 0 1.07% 2.91% 


GI (100/400) 
CMS 








1.52% 2.73% 


26.39% | 100.00% 














从 表 3-1 所 示 的 结果 可 见 ， 对 于 telco 来 说 ， 软 实时 目标 失败 的 概率 
控制 在 0.5%~0.7% 之 间 ，SPECjbb 就 要 差 一 些 ， 但 也 控制 在 2%~59% 之 
间 ， 概 率 随 着 (X/Y) 的 比值 减 小 而 增加 。 另 一 方面 ， 失 败 时 超出 允许 





GC 时 间 的 比值 随 着 总 时 间 片 段 增 加 而 变 小 〈 分 母 变 大 了 ) ， 在 
《100/200) 、512MB 的 配置 下 ，G1 收 集 器 出 现 了 某 些 时 间 片 段 下 100% 
时 间 在 进行 GC 的 最 坏 情 况 。 而 相 比 之 下 ，CMS 收 集 器 的 测试 结果 就 要 
差 很 多 ，3 种 Java 堆 容量 下 都 出 现 了 100% 时 间 进 行 GC 的 情况 。 





在 吞吐 量 测试 中 ， 测 试 数据 取 3 次 SPECjbb 和 15 次 telco 的 平均 结果 如 
图 3-12 所 示 。 在 SPECjbb 的 应 用 下 ， 各 种 配置 下 的 G1 收集 器 表现 出 了 一 
致 的 行为 ， 吞 吐 量 看 起 来 只 与 多 许 最 大 GC 时 间 成 正比 关系 ， 而 在 telco 
的 应 用 中 ， 不 同 配置 对 吞吐 量 的 影响 则 显得 很 微弱 。 与 CMS 收集 器 的 吞 
吐 量 对 比 可 以 看 到 ， 在 SPECjbb 测 试 中 ， 在 堆 容 量 超过 768MB 时 ，CMS 
收集 器 有 5%~10% 的 优势 ， 而 在 telco 测 试 中 ，CMS 的 优势 则 要 小 一 些 ， 
只 有 3%~4% 左 右 。 


























Throughput(1000 ops/sec) 














+ + + + 用 人 + + 上 
640 768 896 1024 1140 384 512 640 
Heap Size (MBs) Heap Size (MBs) 


图 3-12 ”吞吐 量 测试 结果 


在 更 大 规模 的 生产 环境 下 ， 笔 者 引用 一 段 在 StackOverflow.com 上 看 
到 的 经 验 与 读者 分 享 : “我 在 一 个 真实 的 、 较 大 规模 的 应 用 程序 中 使 用 





过 G1: 大 约 分 配 有 60~70GB 内 存 ， 存 活 对 象 大 约 在 20~50GB 之 间 。 服 务 
器 运行 Linux 操 作 系 统 ，JDK 版 本 为 6u22。G1 与 PS/PS Old 相 比 ， 最 大 的 
好 处 是 停顿 时 间 更 加 可 控 、 可 预测 ， 如 果 我 在 PS 中 设置 一 个 很 低 的 最 大 
允许 GC 时 间 ， 臂 如 期 望 50 坚 秒 内 完成 GC 〈- 
XX:MaxGCPauseMillis=50〉 ， 但 在 65GB 的 Java 堆 下 有 可 能 得 到 的 直接 
结果 是 一 次 长 达 30 秒 至 2 分 钟 的 漫长 的 Stop-The-World 过 程 ， 而 G1 与 
CMS 相 比 ， 虽 然 它 们 都 立足 于 低 停顿 时 间 ，CMS 仍 然 是 我 现在 的 选 

择 ， 但 是 随 着 Oracle 对 G1 的 持续 改进 ， 我 相信 G1 会 是 最 终 的 胜利 者 。 如 
果 你 现在 采用 的 收集 器 没有 出 现 问 题 ， 那 就 没有 任何 理由 现在 去 选择 
G1， 如 果 你 的 应 用 追求 低 停顿 ， 那 G1 现在 已 经 可 以 作为 一 个 可 尝试 的 
选择 ， 如 果 你 的 应 用 追求 吞吐 量 ， 那 G1 并 不 会 为 你 带 来 什么 特别 的 好 





3.5.8 理解 GC 日 志 


阅读 GC 日 志 是 处 理 Java 虚 拟 机 内 存 问 题 的 基础 技能 ， 它 只 是 一 些 人 
为 确定 的 规则 ， 没 有 太 多 技术 含量 。 在 本 书 的 第 1 版 中 没有 专门 讲解 如 
何 阅读 分 析 GC 日 志 ， 为 此 作者 收 到 许多 读者 来 信 ， 反 映 对 此 感到 困 
惑 ， 因 此 专门 增加 本 节 内 容 来 讲解 如 何 理 解 GC 日 志 。 








每 一 种 收集 器 的 日 志 形 式 都 是 由 它们 上 自 员 的 实现 所 决定 的 ， 换 而 言 
之 ， 每 个 收集 器 的 日 志 格 式 都 可 以 不 一 样 。 但 虚拟 机 设计 者 为 了 方便 用 
户 阅 读 ， 将 各 个 收集 器 的 日 志 都 维持 一 定 的 共性 ， 例 如 以 下 两 段 典 型 的 
GC 日 志 : 





33.125: [GC [DefNew: 3324K->152K (3712K) ，0.0025925 secs]3324K-> 
152K (11904K) ，0.0031680 secs] 

100.667: [Eull GC[Tenured:0 K->210K (10240K) ，0.0149142secs]4603K- 
>>210K (19456K) ， [Perm:2999K->2999K (21248K) ]，0.0150007 secs] 
[Times:user=0.01 sys=0.00, real=0.02 secs ] 








最 前 面 的 数字 “33.125: ”和 “100.667: ”代表 了 GC 发 生 的 时 间 ， 这 个 
数字 的 含义 是 从 Java 虚 拟 机 启动 以 来 经 过 的 秒 数 。 


GC 日 志 开 头 的 "[GC" 和 "[Full GC" 说 明了 这 次 垃圾 收集 的 停顿 类 
型 ， 而 不 是 用 来 区 分 新 生 代 GC 还 是 老年 代 GC 的 。 如 果 有 "Full"， 说 明 
这 次 GC 是 发 生 了 Stop-The-World 的 ， 例 如 下 面 这 段 新 生 代 收 集 器 
ParNew 的 日 志 也 会 出 现 "[Full GC" (这 一 般 是 因为 出 现 了 分 配 担 保 失败 








之 类 的 问题 ， 所 以 才 导 致 STW) 。 如 宁 是 调用 System.gc(0 方 法 所 触发 的 


收集 ， 那 么 在 这 里 将 显示 "[Full GC (System) "。 





[Full GC 283.736: [ParNew:261599K- 这 >261599K (261952K) ，0.0000288 
secs] 





接 下 来 的 "[DefNew"、"[Tenured"、"[Perm" 表 示 GC 发 生 的 区 域 ， 这 
里 显示 的 区 域名 称 与 使 用 的 GC 收集 器 是 密切 相关 的 ， 例 如 上 面 样 例 所 
使 用 的 Serial 收 集 器 中 的 新 生 代 名 为 "Default New Generation"， 所 以 显示 
的 是 "[DefNew"。 如 果 是 ParNew 收 集 器 ， 新 生 代 名 称 就 会 变 为 " 
[ParNew"， 意 为 "Parallel New Generation"。 如 果 采 用 Parallel Scavenge 收 
集 器 ， 那 它 配套 的 新 生 代 称 为 "PSYoungGen"， 老 年 代 和 永久 代 同 理 ， 
名 称 也 是 由 收集 器 决定 的 。 


后 面 方 括号 内 部 的 "3324K->152K (3712K) "含义 是 “GC 前 该 内 存 
区 域 已 使 用 容量 ->GC 后 该 内 存 区 域 已 使 用 容量 〈 该 内 存 区 域 总 容 
量 ) ”。 而 在 方 括号 之 外 的 "3324K- 二 152K (11904K) "表示 “GC 前 Java 
堆 已 使 用 容量 ->GC 后 Java 扒 已 使 用 容量 〈Java 扒 总 容量 ) ”。 





再 往 后 ，"0.0025925 secs" 表 示 该 内 存 区 域 GC 所 占用 的 时 间 ， 单 位 
是 秒 。 有 的 收集 器 会 给 出 更 具体 的 时 间 数 据 ， 如 "[Times:user=0.01 
sys=0.00，real=0.02 secs]"， 这 里 面 的 user、sys 和 real 与 Linux 的 time 命 令 
所 输出 的 时 间 含 义 一 致 ， 分 别 代 表 用 户 态 消 耗 的 CPU 时 间 、 内 核 态 消耗 
的 CPU 事件 和 操作 从 开始 到 结束 所 经 过 的 墙 钟 时 间 (Wall Clock 


Time) 。CPU 时 间 与 墙 钟 时 间 的 区 别 是 ， 墙 钟 时 间 包 括 各 种 非 运算 的 等 
符 耗 时 ， 例 如 等 待 磁盘 IO、 等 待 线程 阻塞 ， 而 CPU 时 间 不 包括 这 些 耗 
时 ， 但 当 系 统 有 多 CPU 或 者 多 核 的 话 ， 多 线程 操作 会 登 加 这 些 CPU 时 
间 ， 所 以 读者 看 到 user 或 sys 时 间 超 过 real 时 间 是 完全 正常 的 。 


3.5.9 ”垃圾 收集 器 参数 总 结 


JDK 1.7 中 的 各 种 垃圾 收集 器 到 此 已 全 部 介绍 完毕 ， 在 描述 过 程 中 
提 到 了 很 多 虚拟 机 非 稳定 的 运行 参数 ， 在 表 3-2 中 整理 了 这 些 参数 供 读 
者 实践 时 参考 ，。 





表 3-2 垃圾 收集 相关 的 常用 参数 


参 数 描 述 
虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Serial + 
Serial Old 的 收集 器 组 合 进行 内 存 回收 
UseParNewGC 打开 此 开关 后 ， 使 用 ParNew + Serial Old 的 收集 器 组 全 进行 内 存 回 收 
打开 此 开关 后 ， 使 用 ParNew + CMS + Serial Old 的 收集 器 组 合 进行 内 存 


UseSerialGC 


UseConcMarkSweepGC 回收 。Serial Old 收集 器 将 作为 CMS 收集 器 出 现 Concurrent Mode Failure 
失败 后 的 后 备 收集 器 使 用 
ee 虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Parallel 
sk Scavenge + Serial Old (PS MarkSweep) 的 收集 器 组 合 进行 内 存 回 收 
es 打开 此 开 关 后 ， 使 用 Parallel Scavenge + Parallel Old 的 收集 器 组 全 进行 
内 存 回 收 
新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 ， 默 认为 8， 代 表 
SurvivorRatio 
Eden : Survivor=8 : 1 
Dt 直接 晋升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 大 参数 的 对 象 
将 直接 在 老年 代 分 配 


晋升 到 老年 代 的 对 象 年 龄 。 每 个 对 象 在 坚持 过 一 次 Minor GC 之 后 ， 年 


MaxT ineThreshold 
ee 龄 就 增加 1， 当 超过 这 个 参数 值 时 就 进入 老年 代 


UseAdaptiveSizePolicy 
HandlePromotionFailure 


ParallelGCThreads 


动态 调整 Java 堆 中 各 个 区 域 的 大 小 以 及 进入 老年 代 的 年 龄 

是 否 允 许 分 配 担保 失败 ， 即 老年 代 的 剩余 空间 不 足以 应 付 新 生 代 的 整个 
Eden 和 Survivor 区 的 所 有 对 象 都 存活 的 极端 情况 

设置 并 行 GC 时 进行 内 存 回收 的 线程 数 


参 数 
GCTimeRatio 
MaxGCPauseMillis 


CMSInitiatingOccupancyFraction 


UseCMSCompactAtFullCollection 


CMSFullGCsBeforeCompaction 


( 续 ) 


描 述 

GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 的 GC 时 间 。 仅 在 
使 用 Parallel Scavenge 收集 器 时 生效 

设置 GC 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 

设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 垃圾 收集 。 默 认 值 为 
68%， 仅 在 使 用 CMS 收集 器 时 生效 

设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 次 内 存 碎 片 整理 。 仅 
在 使 用 CMS 收集 器 时 生效 

设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 一 次 内 存 碎 片 整理 。 
仅 在 使 用 CMS 收集 器 时 生效 


3.6 ”内 存 分 配 与 回收 策略 





Java 技 术 体系 中 所 提倡 的 目 动 内 存 管理 最 终 可 以 归结 为 自动化 地 解 
决 了 两 个 问题 : 给 对 象 分 配 内 存 以 及 回收 分 配给 对 象 的 内 存 。 关 于 回收 
内 存 这 一 点 ， 我 们 已 经 使 用 了 大 量 篇 幅 去 介绍 虚拟 机 中 的 志 圾 收集 融 体 
系 以 及 运作 原理 ， 现 在 我 们 再 一 起 来 探讨 一 下 给 对 象 分 配 内 存 的 那 点 事 
儿 。 





对 象 的 内 存 分 配 ， 往 大 方向 讲 ， 就 是 在 堆 上 分 配 《〈 但 也 可 能 经 过 
JIT 编 译 后 被 拆散 为 标量 类 型 并 间接 地 栈 上 分 配 由 ) ， 对 象 主要 分 配 在 
新 生 代 的 Eden 区 上 ， 如 果 启 动 了 本 地 线程 分 配 缓冲 ， 将 按 线程 优先 在 
TLAB 上 分 配 。 少 数 情况 下 也 可 能 会 直接 分 配 在 老年 代 中 ， 分 配 的 规则 
并 不 是 百分之百 固定 的 ， 其 细节 取决 于 当前 使 用 的 是 哪 一 种 垃圾 收集 器 
组 合 ， 还 有 虚拟 机 中 与 内 存 相关 的 参数 的 设置 。 


接 下 来 我 们 将 会 讲解 几 条 最 普遍 的 内 存 分 配 规则 ， 并 通过 代码 去 验 
证 这 些 规则 。 本 节 下 面 的 代码 在 测试 时 使 用 Client 模 式 虚 拟 机 运行 ， 没 
有 手工 指定 收集 器 组 合 ， 换 名 话说 ， 验 证 的 是 在 使 用 SerialSerial Old 收 
集 器 下 〈ParNew/Serial Old 收集 器 组 合 的 规则 也 基本 一 致 ) 的 内 存 分 配 
和 回收 的 策略 。 读 者 不 妨 根据 自己 项 目 中 使 用 的 收集 器 写 一 些 程序 去 验 
证 一 下 使 用 其 他 几 种 收集 器 的 内 存 分 配 策略 。 





3.6.1 对象 优 先 在 Eden 分 配 





大 多 数 情况 下 ， 对 象 在 新 生 代 Eden 区 中 分 配 。 当 Eden 区 没有 足够 空 
间 进 行 分 配 时 ， 虚 拟 机 将 发 起 一 次 Minor GC。 


虚拟 机 提供 了 -XX:+PrintGCDetails 这 个 收集 器 日 志 参 数 ， 告 诉 虚 拟 
机 在 发 生 垃圾 收集 行为 时 打印 内 存 回收 日 志 ， 并 且 在 进程 退出 的 时 候 输 
出 当前 的 内 存 各 区 域 分 配 情 况 。 在 实际 应 用 中 ， 内 存 回 收 日 志 一 般 是 打 
印 到 文件 后 通过 日 志 工 具 进 行 分 析 ， 不 过 本 实验 的 日 志 并 不 多 ， 下 接 阅 


读 就 能 看 得 很 清楚 。 





代码 清单 3-5 的 testAllocation0 方 法 中 ， 尝 试 分 配 3 个 2MB 大 小 和 1 个 
4MB 大 小 的 对 象 ， 在 运行 时 通过 -Xms20M、-Xmx20M、-Xmn10M 这 3 个 
参数 限制 了 Java 堆 大 小 为 20MB， 不 可 扩展 ， 其 中 10MB 分 配给 新 生 代 ， 
剩 下 的 10MB 分 配给 老年 代 。-XX:SurvivorRatio=8 决 定 了 新 生 代 中 Eden 
区 与 一 个 Survivor 区 的 空间 比例 是 8:1， 从 输出 的 结果 也 可 以 清晰 地 看 
到 "eden space 8192K、from space 1024K、to space 1024K" 的 信息 ， 新 生 


代 总 可 用 空间 为 9216KB (Eden 区 +1 个 Survivor 区 的 总 容量 ) 。 


执行 testAllocation() 中 分 配 allocation4 对 象 的 语句 时 会 发 生 一 次 
Minor GC， 这 次 GC 的 结 末 是 新 生 代 6651KB 变 为 148KB， 而 总 内 存 占 用 
量 则 几乎 没有 减少 (因为 allocation1、allocation2、allocation3 三 个 对 象 
都 是 存活 的 ， 虚 拟 机 几乎 没有 找到 可 回收 的 对 象 ，。 这 次 GC 发 生 的 原 





因 是 给 allocation4 分 配 内 存 的 时 候 ， 发 现 Eden 已 经 被 占用 了 6MB， 剩 余 
空间 已 不 足以 分 配 allocation4 所 需 的 4MB 内 存 ， 因 此 发 生 Minor GC。GC 
期 间 虚 拟 机 又 发 现 已 有 的 3 个 2MB 大 小 的 对 象 全 部 无 法 放 入 Survivor 空 间 

CSurvivor 空 间 只 有 1MB 大 小 ) ， 所 以 只 好 通过 分 配 担保 机 制 提 前 转移 
到 老年 代 去 。 


这 次 GC 结束 后 ，4MB 的 allocation4 对 象 顺 利 分 配 在 Eden 中 ， 因 此 程 
序 执行 完 的 结果 是 Eden 占 用 4MB (被 allocation4 占 用 ) ，Survivor 空 闲 ， 
老年 代 被 占用 6MB 〈 被 allocation1、allocation2、allocation3 占 用 ) 。 通 
过 GC 日 志 可 以 证 实 这 一 扩 。 


注意 ”作者 多 次 提 到 的 Minor GC 和 Full GC 有 什么 不 一 样 吗 ? 


新 生 代 GC (Minor GC) : 指 发 生 在 新 生 代 的 垃圾 收集 动作 ， 因 为 
Java 对 象 大 多 都 具备 朝 生 夕 灭 的 特性 ， 所 以 Minor GC 非常 频繁 ， 一 般 回 
收 速度 也 比较 快 。 





老年 代 GC (Major GC/Full GC) : 指 发 生 在 老年 代 的 GC， 出 现 了 
Major GC， 经 常会 伴随 至 少 一 次 的 Minor GC (但 非 绝 对 的 ， 在 Parallel 
Scavenge 收 集 器 的 收集 策略 里 就 有 直接 进行 Major GC 的 策略 选择 过 
程 ) 。Major GC 的 速度 一 般 会 比 Minor GC 慢 10 倍 以 上 。 





代码 清单 3-5 ”新 生 代 Minor GC 














private static final int lMB=1024*1024; 

/** 

*VM 参 数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails 
-XX:SurvivorRatio=8 


*/ 



























































public static void testAllocation()f{ 
bytel]jallocationl, allocation2, allocation3, allocation4; 
allocationl=new byte[2x 1MB]; 
allocation2=new byte[2x 1MB]; 
allocation3=new byte[2x 1MB]; 
allocation4=new byte[4* 1MB]; // 出 现 一 次 Minor GC 
} 
运行 结果 





[GC [DefNew:6651K->148K (9216K) ，0.0070106 secs]6651K-> 
6292K (19456K), 

0.0070426 secs] [Times:user=0.00 sys=0.00, real=0.00 secs|] 

Heap 

def new generation total 9216K,used 4326K[0x029d0000, 0x0339d0000， 
0x033qd0000) 

eden space 8192K, 51l1%used[0x029d0000,，0x02de4828, 0x03140000) 
from space 1024K，14s$used[0x032dq0000，0x032f5370，0x033q0000) 
to space 1024K, 0%used[0x031d0000,，0x031d0000，0x032d0000) 
tenured generation total 10240K,used 6144K[0x033d0000， 
0x03dqd0000，0x03dq0000) 
the space 10240K, 60%used[0x033d0000,，0x039d0030，0x039d0200， 
0x03dqd0000) 

compacting perm gen total 12288K,used 2114K[0x03dd0000， 
0x049qd0000，0x07dqd0000) 

the space 12288K, 17%used[0x03dd0000,， 0x03fe0998, 0x03fe0a00， 
0x049q0000) 

No shared spaces configured. 
































[1JIT 即 时 编译 器 相关 优化 可 参见 第 11 章 。 


3.6.2 ”大 对 象 直接 进入 老年 代 


所 谓 的 大 对 象 是 指 ， 需 要 大 量 连续 内 存 空间 的 Java 对 象 ， 最 典型 的 
大 对 象 束 古 那 种 很 长 的 字符 串 以 及 数组 (笔者 列 出 的 例子 中 的 byte[] 数 
组 就 是 典型 的 大 对 象 ) 。 大 对 象 对 虚拟 机 的 内 存 分 配 来 说 就 是 一 个 坏 消 
恩 〈 蔡 Java 虚 拟 机 抱怨 一 句 ， 比 遇 到 一 个 大 对 象 更 加 坏 的 消 妃 就 是 遇 到 
一 群 < 朝 生 夕 灭 ”的 “短命 大 对 象 ”， 写 程序 的 时 候 应 当 避 免 ) ， 经 党 出 现 
大 对 象 容 易 导 致 内 存 还 有 不 少 空间 时 就 提前 触发 垃圾 收集 以 获取 足够 的 
连续 空间 来 “安置 "它们 。 





虚拟 机 提供 了 一 个 -XX:PretenureSizeThreshold 参 数 ， 令 大 于 这 个 设 
置 值 的 对 象 直接 在 老年 代 分 配 。 这 样 做 的 目的 是 避免 在 Eden 区 及 两 个 
Survivor 区 之 间 发 生 大 量 的 内 存 复 制 (复习 一 下 : 新 生 代 采 用 复制 算法 
收集 内 存 ) 。 








执行 代码 清单 3-6 中 的 testPretenureSizeThreshold() 方 法 后 ， 我 们 看 到 
Eden 空 间 几 乎 没有 被 使 用 ， 而 老年 代 的 10MB 衬 间 被 使 用 了 40%， 也 就 
是 4MB 的 allocation 对 象 直接 就 分 配 在 老年 代 中 ， 这 是 因为 
PretenureSizeThreshold 被 设置 为 3MB (就 是 3145728， 这 个 参数 不 能 像 - 
Xmx 之 类 的 参数 一 样 直 接 写 3MB) ， 因 此 超过 3MB 的 对 象 都 会 直接 在 老 
年 代 进 行 分 配 。 注 意 ”PretenureSizeThreshold 参 数 只 对 Serial 和 ParNew 两 


于 收集 器 有 效 ，Parallel Scavenge 收 集 器 不 认识 这 个 参数 ，Parallel 
Scavenge 收 集 器 一 般 并 不 需要 设置 。 如 采 遇 到 必须 使 用 此 参数 的 场合 ， 
可 以 考虑 ParNew 加 CMS 的 收集 器 组 合 。 


代码 清单 3-6 ”大 对 象 直接 进入 老年 代 














private static final int 1IMB=1024*1024; 

/** 

*VM 参 数 : -verbose:gc-xms20M-Xmx20M-xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8 

*—XX:PretenureSizeThreshold=3145728 

yy 

public static void testPretenureSizeThreshold()t{ 

byte[l]allocation; 

allocation=new byte[4* 1MB]; // 直 接 分 配 在 老年 代 中 























Heap 

def new generation total 9216K,used 671K[0x029dq0000，0x033d0000， 
0x033q0000) 

eden space 8192K，8sused[0x029dq0000，0x02a77e98，0x031q0000) 
from space 1024K，0susedq[0x031d0000，0x031d0000，0x032dq0000) 
to space 1024K, 0Sused[0x032d0000，0x032d0000，0x033d0000) 
tenured generation total 10240K,used 4096K[0x033d0000， 
0x03dqd0000，0x03dq0000) 
the space 10240K, 40%used[0x033d0000, 0x037d0010,，0x037d0200， 
0x03dqd0000) 

compacting perm gen total 12288K,used 2107K[0x03dd0000， 
0x049qd0000，0x07dqd0000) 
the space 12288K, 17%used[0x03dqd0000, 0x03fdefd0, 0x03fdf000,， 
0x049q0000) 
No shared spaces configured. 
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3.6.3 ”长 期 存活 的 对 象 将 进入 老年 代 


既然 虚拟 机 采用 了 分 代 收 集 的 思想 来 管理 内 存 ， 那 么 内 存 回 收 时 就 
必须 能 识别 哪些 对 象 应 放 在 新 生 代 ， 哪 些 对 象 应 放 在 老年 代 中 。 为 了 做 
到 这 点 ， 虚 拟 机 给 每 个 对 象 定义 了 一 个 对 象 年 龄 (Age) 计数 器 。 如 采 
对 象 在 Eden 出 生 并 经 过 第 一 次 Minor GC 后 仍然 存活 ， 并 且 能 被 Survivor 
容纳 的 话 ， 将 被 移动 到 Survivor 空 间 中 ， 并 且 对 象 年 龄 设 为 1。 对 象 在 
Survivor 区 中 每 “ 熬 过 ”一 次 Minor GC， 年 龄 就 增加 1 岁 ， 当 它 的 年 龄 增加 
到 一 定 程度 〈 默 认为 15 岁 ) ， 就 将 会 被 晋升 到 老年 代 中 。 对 象 晋 升 老年 
代 的 年 龄 阔 值 ， 可 以 通过 参数 -XX:MaxTenuringThreshold 设 置 。 





读者 可 以 试 试 分 别 以 -XX:MaxTenuringThreshold=1 和 和 - 
XX:MaxTenuringThreshold=15 两 种 设置 来 执行 代码 清单 3-7 中 的 
testTenuringThreshold() 方 法 ， 此 方法 中 的 allocation1 对 象 需要 256KB 内 
存 ，Survivor 空 间 可 以 容纳 。 当 MaxTenuringThreshold=1 时 ，allocation1 
对 象 在 第 二 次 GC 发 生 时 进入 老年 代 ， 新 生 代 已 使 用 的 内 存 GC 后 非常 干 
净 地 变 成 0KB。 而 MaxTenuringThreshold=15 时 ， 第 二 次 GC 发 生 后 ， 
allocation1 对 象 则 还 留 在 新 生 代 Survivor 空 间 ， 这 时 新 生 代 仍然 有 404KB 
被 占用 。 








代码 清单 3-7 长 期 存活 的 对 象 进 入 老年 代 

















private static final int lMB=1024*1024; 

/** 

*VM 参 数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetail1s- 
XX:SurvivorRatio=8-XX:MaxTenuringThreshold=1 

*—XX:+PrintTenuringDistribution 

wp 

@QSuppressWarnings ("unused") 

public static void testTenuringThreshold(){ 

byte[l]allocationl, allocation2, allocation3; 
allocationl=new byte[ lMB/4]; 
/ /什么 时 候 进 入 老年 代 取 决 于 Xx:MaxTenuringThreshold 设 置 
allocation2=new byte[4* lMB]:; 
allocation3=new byte[4* 1IMB]; 
al 
al 
} 









































location3=null; 
location3=new byte[4* lMB]; 









































以 MaxTenuringThreshold=1 参 数 来 运行 的 结果 : 





[GC [DefNew 

Desired Survivor size 524288 bytes,new threshold 1 (max 1) 

-age 1:414664 bytes, 414664 total 

:4859K->404K (9216K) ，0.0065012 secs]4859K- 二 4500K (19456K) ， 
0.0065283 secs] [Times:user=0.02 sys=0.00, real=0.02 secs] 

[GC [DefNew 

Desired Survivor size 524288 bytes,new threshold 1 (max 1) 

:4500K->0K (9216K) ，0.0009253 secs]8596K-> 二 4500K (19456K) ， 
0.0009458 secs] [Times:user=0.00 sys=0.00, real=0.00 secs] 

Heap 

def new generation total 9216K,used 4178K[0x029ada0000，0x033d0000， 
0x033qd0000) 

eden space 8192K, 5l1%used[0x029d0000,，0x02de4828,， 0x03140000) 
from space 1024K，0gsusedq[0x031d0000，0x031dq0000，0x032q0000 ) 
to space 1024K, 0%used[0x032d0000,，0x032d0000，0x033d0000) 
tenured generation total 10240K,used 4500K[0x033d0000， 
0x03dqd0000，0x03dq0000) 
the space 10240K，43g5usedq[0x033d0000，0x03835348，0x03835400， 
0x03dqd0000) 

compacting perm gen total 12288K,used 2114K[0x03dada0000， 
0x049qd0000，0x07dqd0000) 
the space 12288K, 17%used[0x03dd0000,， 0x03fe0998, 0x03fe0a00， 
0x049q0000) 
No shared spaces configured. 
以 MaxTenuringThresholdq=15 参 数 来 运行 的 结果 : 
[GC [DefNew 












































Desired Survivor size 524288 bytes,new threshold 15 (max 15) 

-age 1:414664 bytes, 414664 total 

:4859K-> 二 404K (9216K) ，0.0049637 secs]4859K- 二 4500K (19456K) ， 
0.0049932 secs] [Times:user=0.00 sys=0.00, real=0.00 secs] 

[GC [DefNew 

Desired Survivor size 524288 bytes,new threshold 15 (max 15) 

-age 2:414520 bytes, 414520 total 

:4500K->404K (9216K) ，0.0008091 secs]8596K- 二 4500K (19456K) ， 
0.0008305 secs] [Times:user=0.00 sys=0.00, real=0.00 secs] 

Heap 

def new generation total 9216K,used 4582K[0x029ada0000，0x033d0000， 
0x033d0000) 

eden space 8192K, 51l1%used[0x029d0000,， 0x02de4828,， 0x0314d0000) 
from space 1024K, 39%used[0x031d0000,，0x03235338，0x032d0000) 
to space 1024K, 0%used[0x032d0000,，0x032d0000，0x033d0000) 
tenured generation total 10240K,used 4096K[0x033d0000， 
0x03dqd0000，0x03dq0000) 
the space 10240K, 40%used[0x0339d0000,， 0x037d0010,，0x037d0200， 
0x03dqd0000) 

compacting perm gen total 12288K,used 2114K[0x03dqd0000， 
0x049qd0000，0x07dqd0000) 
the space 12288K, 17%used[0x03dd0000, 0x03fe0998, 0x03fe0a00,， 
0x049q0000) 
No shared spaces configured. 
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3.6.4 动态 对 象 年 龄 判定 





为 了 能 更 好 地 适应 不 同 程序 的 内 存 状 况 ， 虚 拟 机 并 不 是 永远 地 要 求 
对 象 的 年 龄 必须 达到 了 MaxTenuringThreshold 才 能 晋升 老年 代 ， 如 果 在 
Survivor 空 间 中 相同 年 龄 所 有 对 象 大 小 的 总 和 大 于 Survivor 空 间 的 一 半 ， 
年 龄 大 于 或 等 于 该 年 龄 的 对 象 就 可 以 直接 进入 老年 代 ， 无 须 等 到 
MaxTenuringThreshold 中 要 求 的 年 龄 。 


执行 代码 清单 3-8 中 的 testTenuringThreshold20) 方 法 ， 并 设置 - 
XX:MaxTenuringThreshold=15， 会 发 现 运行 结果 中 Survivor 的 空间 占用 
仍然 为 0%， 而 老年 代 比 预期 增加 了 6%， 也 就 是 说 ，allocation1、 
allocation2 对 象 都 直接 进入 了 老年 代 ， 而 没有 等 到 15 岁 的 临界 年 龄 。 
为 这 两 个 对 象 加 起 来 已 经 到 达 了 512KB， 并 且 它 们 是 同年 的 ， 满 足 同 年 
对 象 达 到 Survivor 空 间 的 一 半 规 则 。 我 们 只 要 注释 掉 其 中 一 个 对 象 new 操 
作 ， 就 会 发 现 另 外 一 个 就 不 会 晋升 到 老年 代 中 去 了 。 


代码 清单 3-8 动态 对 象 年 龄 判定 

















private static final int 1IMB=1024*1024; 

/** 

*VM 参 数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8-XX:MaxTenuringThreshold=15 

*—XX:+PrintTenuringDistribution 

wy/ 

@QSuppressWarnings ("unused") 

public static void testTenuringThreshold2()1 

bytel]jallocationl, allocation2, allocation3, allocation4; 


































































































allocationl=new byte[ lMB/4]:; 
//allocationl+allocation2 大 于 survivo 空 间 一 半 
allocation2=new byte[ lMB/4]:; 
allocation3=new byte[4x 1]MB]; 
allocation4=new byte[4* 1]MB]; 
allocation4=null; 
allocation4=new byte[4* 1]MB]; 

} 

运行 结果 

[GC [DefNew 





Desired Survivor size 524288 bytes,new threshold 1 (max 15) 

-age 1:676824 bytes, 676824 total 

:5115K->>660K (9216K) ，0.0050136 secs]5115K- 这 4756K (19456K)， 
0.0050443 secs] [Times:user=0.00 sys=0.01, real=0.01 secs] 

[GC [DefNew 

Desired Survivor size 524288 bytes,new threshold 15 (max 15) 

:4756K->0K (9216K) ，0.0010571 secs]8852K- 福 4756K (19456K) ， 
0.0011009 secs] [Times:user=0.00 sys=0.00, real=0.00 secs] 

Heap 

def new generation total 9216K,used 4178K[0x029ada0000，0x033d0000， 
0x033q0000) 

eden space 8192K, 5l%$used[0x029d0000, 0x02de4828,， 0x031d0000) 
from space 1024K，0susedq[0x031d0000，0x031d0000，0x032dq0000 ) 
to space 1024K, 0Sused[0x032d0000,，0x032d0000，0x033d0000) 
tenured generation total 10240K,used 4756K[0x033d0000， 
0x03dqd0000，0x03dq0000) 
the space 10240K, 46%used[0x033d0000, 0x038753e8,，0x03875400,， 
0x03dqd0000) 

compacting perm gen total 12288K,used 2114K[0x03dqd0000， 
0x049d0000，0x07dqd0000) 
the space 12288K, 17%used[0x03dqd0000, 0x03fe09a0,，0x03fe0a00,， 
0x049q0000) 
No shared spaces configured. 
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3.6.5 ”空间 分 配 担保 


在 用 生 Minor GC 之 前 ， 虚 拟 机 会 先 检查 老年 代 最 大 可 用 的 连续 空间 
是 否 大 于 新 生 代 所 有 对 象 总 空间 ， 如 果 这 个 条 件 成 立 ， 那 么 Minor GC 可 
以 确保 是 安全 的 。 如 果 不 成 立 ， 则 虚拟 机 会 但 看 HandlePromotionFailure 
设置 值 是 否 允 许 担保 失败 。 如 果 人 允许 ， 那 么 会 继续 检查 老年 代 最 大 可 用 
的 连续 空间 是 否 大 于 历次 晋升 到 老年 代 对 象 的 平均 大 小 ， 如 果 大 于 ， 将 
尝试 着 进行 一 次 Minor GC， 尽 管 这 次 Minor GC 是 有 风险 的 ， 如 果 小 
于 ， 或 者 HandlePromotionFailure 设 置 不 允许 冒险 ， 那 这 时 也 要 改 为 进行 
一 次 Full GC。 




















下 面 解释 一 下 “冒险 ”是 冒 了 什么 风险 ， 前 面 提 到 过 ， 新 生 代 使 用 复 
制 收集 算法 ， 但 为 了 内 存 利 用 率 ， 只 使 用 其 中 一 个 Survivor 空 间 来 作为 
轮换 备份 ， 因 此 当 出 现 大 量 对 象 在 Minor GC 后 仍然 存活 的 情况 (最 极端 
的 情况 就 是 内 存 回收 后 新 生 代 中 所 有 对 象 都 存活 ) ， 就 需要 老年 代 进行 
分 配 担保 ， 把 Survivor 无 法 容纳 的 对 象 直接 进入 老年 代 。 与 生活 中 的 贷 
款 担 保 类 似 ， 老 年 代 要 进行 这 样 的 担保 ， 前 提 是 老年 代 本 身 还 有 容纳 这 
些 对 象 的 剩余 空间 ， 一 共有 多 少 对 象 会 活 下 来 在 实际 完成 内 存 回收 之 前 
是 无 法 明确 知道 的 ， 所 以 只 好 取 之 前 每 一 次 回收 晋升 到 老年 代 对 象 容量 
的 平均 大 小 值 作为 经 验 值 ， 与 老年 代 的 剩余 空间 进行 比较 ， 决 定 是 否 
行 Full GC 来 让 老年 代 腾 出 更 多 空间 。 














取 平 均值 进行 比较 其 实 仍 然 是 一 种 动态 概率 的 手段 ， 也 就 是 说 ， 如 
果 某 次 Minor GC 存活 后 的 对 象 突 增 ， 远 远 高 于 平均 值 的 话 ， 依 然 会 导致 
担保 失败 (Handle Promotion Failure) 。 如 果 出 现 了 
HandlePromotionFailure 失 败 ， 那 就 只 好 在 失败 后 重新 发 起 一 次 Full GC。 
虽然 担保 失败 时 绕 的 圈子 是 最 大 的 ， 但 大 部 分 情况 下 都 还 是 会 将 
HandlePromotionFailure 开 关 打 开 ， 避 免 Full GC 过 于 频繁 ， 参 见 代 码 清 单 


3-9， 请 读者 在 JDK 6 Update 24 之 前 的 版 本 中 运行 测试 。 





代码 清单 3-9 空间 分 配 担保 

















private static final int lMB=1024*1024; 

/** 

*VM 参 数 ; -Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8-XX:-HandlePromotionFailure 

Ww 

@QSuppressWarnings ("unused") 

public static void testHandqlePromotion() { 

byte[l]jallocationl, allocation2, allocation3, allocation4, 
allocation5, allocation6, allocationy7; 

allocationl=new byte[2x 1MB]; 
location2=new byte[2x 1MB]; 
location3=new byte[2x lMB]; 
locationl=null; 
location4=new byte[2x 1]MB]; 
location5=new byte[2x 1]MB]; 
] tion6=new byte[2* 1MB]; 
location4=null; 
location5=null; 
location6=null; 
location7=new byte[l2* 1MB]; 
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以 HandlePromotionFailure=false 参 数 来 运行 的 结 





[GC [DefNew:6651K->148K (9216K) ，0.0078936 secs]6651K-> 
4244K (19456K) ,， 0.0079192 secs] [Times:user=0.00 sys=0.02, real=0.02 























secs] 

[GC [DefNew:6378K->>6378K (9216K) ，0.0000206secs] [Tenured:4096K-> 
4244K (10240K) ，0.0042901 secs]10474K- 福 4244K (19456K) ，[Perm:2104K-> 
2104K (12288K) ]，0.0043613 secs] [Times:user=0.00 sys=0.00, real=0.00 
secs] 





以 HandlePromotionFailure=true 参 数 来 运行 的 结果 : 





[GC [DefNew:6651K->>148K (9216K) ，0.0054913 secs]6651K-> 
4244K (19456K) ，0.0055327 secs] [Times:user=0.00 sys=0.00, real=0.00 
secs] 

[GC [DefNew:6378K->148K (9216K) ，0.0006584 secs]10474K-> 
4244K (19456K) ， 0.0006857 secs] [Times:user=0.00 sys=0.00, real=0.00 
secs] 











在 JDK 6 Update 24 之 后 ， 这 个 测试 结果 会 有 差异 ， 
HandlePromotionFailure 参 数 不 会 再 影响 到 虚拟 机 的 空间 分 配 担 保 集 略 ， 
观察 OpenJDK 中 的 源码 变化 〈 见 代码 清单 3-10) ， 虽 然 源码 中 还 定义 了 
HandlePromotionFailure 参 数 ， 但 是 在 代码 中 已 经 不 会 再 使 用 它 。JDK 6 
Update 24 之 后 的 规则 变 为 只 要 老年 代 的 连续 空间 大 于 新 生 代 对 象 总 大 小 
或 者 历次 晋升 的 平均 大 小 就 会 进行 Minor GC， 否 则 将 进行 Full GC。 





代码 清单 3-10 ”HotSpot 中 空间 分 配 检查 的 代码 片段 








bool TenuredGeneration:promotion attempt is safe (size t 
max promotion in bytes) constt 


// 老 年代 最 大 可 用 的 连续 空间 

















size t available=max contiguous available (); 
// 每 次 晋升 到 老年 代 的 平均 大 小 
size t av promo= (size 七 ) gc stats()->avg promoted()-> 





padded average () ; 
// 老 年 代 可 用 空间 是 否 大 于 平均 晋升 大 小 ， 或 者 老年 代 可 用 空间 是 否 大 于 当 此 Gc 时 新 生 代 
































所 有 对 象 容量 


bool res= (available>=av promo) || (available>= 
max promotion in bytes) ; 
return Tess 


} 





3.7 ”本章 小 结 


本 章 介 绍 了 垃圾 收集 的 算法 、 几 球 JDK 1.7 中 提供 的 志 圾 收集 右 特 
点 以 及 运作 原理 。 通 过 代码 实例 验证 了 Java 虚 拟 机 中 自动 内 存 分 配 及 回 
收 的 主要 规则 。 








内 存 回收 与 垃圾 收集 器 在 很 多 时 候 都 是 影响 系统 性 能 、 并 发 能 力 的 
主要 因素 之 一 ， 虚 拟 机 之 所 以 提供 多 种 不 同 的 收集 器 以 及 提供 大 量 的 调 
节 参 数 ， 是 因为 只 有 根据 实际 应 用 需求 、 实 现 方式 选择 最 优 的 收集 方式 
才能 获取 最 高 的 性 能 。 没 有 固定 收集 器 、 参 数组 合 ， 也 没有 最 优 的 调 优 
方法 ， 虚 拟 机 也 就 没有 什么 必然 的 内 存 回收 行为 。 因 此 ， 学 习 虚 拟 机 内 
存 知识 ， 如 果 要 到 实践 调 优 阶段 ， 那 么 必须 了 解 每 个 具体 收集 器 的 行 
为 、 优 势 和 劣势 、 调 节 参 数 。 在 接 下 来 的 两 音 中 ， 作 者 将 会 介绍 内 存 分 
析 的 工具 和 调 优 的 一 些 具 体 案例 。 

















第 4 草 ” 虚 拟 机 性 能 监控 与 故 隐 处 理工 具 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 “高 
墙 "， 墙 外 面 的 人 想 进 去 ， 增 里 面 的 人 却 想 出 来 。 


4.1 概述 


经 过 前 面 两 蔓 对 于 虚拟 机 内 存 分 配 与 回收 技术 各 方面 的 介绍 ， 相 信 
读者 已 经 建立 了 一 套 比 较 完 整 的 理论 基础 。 理 论 总 是 作为 指导 实践 的 工 
共 ， 能 把 这 些 知 识 应 用 到 实际 工作 中 才 是 我 们 的 最 终 目 的 。 接 下 来 的 两 
章 ， 我 们 将 从 实践 的 角度 去 了 解 虚拟 机 内 存 管 理 的 世界 。 





给 一 个 系统 定位 问题 的 时 候 ， 知 识 、 经 验 是 关键 基础 ， 数 据 是 依 
据 ， 工 具 是 运用 知识 处 理 数据 的 手段 。 这 里 说 的 数据 包括 : 运行 日 志 、 
异常 堆栈 、GC 日 志 、 线 程 快 照 (threaddump/javacore 文 件 ) 、 堆 转 储 快 
照 (heapdump/hprof 文 件 ) 等 。 经 常 使 用 适当 的 虚拟 机 监控 和 分 析 的 工 
有 具 可 以 加 快 我 们 分 析 数 据 、 定 位 解决 问题 的 速度 ， 但 在 学 习 工 具 前 ， 也 
应 当 意 识 到 工具 永远 都 是 知识 技能 的 一 层 包 装 ， 没 有 什么 工具 是 “秘密 
武器 ”， 不 可 能 学 会 了 就 能 包 治 百 病 。 














对 


Java 开 发 人 员 肯 定 都 知道 JDK 的 bin 目 录 中 
有 "java.exe"、"javac.exe" 这 两 个 命令 行 工具 ， 但 并 非 所 有 程序 员 都 了 解 
过 JDK 的 bin 目 录 之 中 其 他 命令 行程 序 的 作用 。 每 逢 JDK 更 新 版 本 之 时 ， 
bin 目 录 下 命令 行 工 具 的 数量 和 功能 总 会 不 知 不 觉 地 增加 和 增强 。bin 目 
录 的 内 容 如 图 4-1 所 示 。 





在 本 章 中 ， 笔 者 将 介绍 这 些 工具 的 其 中 一 部 分 ， 主 要 包括 用 于 监视 
虚拟 机 和 故障 处 理 的 工具 。 这 些 故 隐 处 理工 具 被 Sun 公 司 作为 “礼物 ” 附 
赠 给 JDK 的 使 用 者 ， 并 在 软件 的 使 用 说 明 中 把 它们 声明 为 “没有 技术 文 
持 并 且 是 实验 性 质 的 ”(unsupported and experimental ) 上 的 产品 ， 但 事 
实 上 ， 这 些 工具 都 非常 稳定 而 且 功 能 强大 ， 能 在 处 理应 用 程序 性 能 问 
题 、 定 位 故障 时 发 挥 很 大 的 作用 。 











Documents (D:}) » _DevSpace » jdk1.6.0 21 » bin 





新 建文 件 夫 


和 收 改 日 期 


| 


xjc.exe 2010/7/19 11:56 


ee 


Mo MO Mo Mo Mu 
书 


图 


瑾 副 开 型 本 


| wsimport.exe 2010/7/19 11:56 
| wsgen,exe 2010/7/19 11:56 
| unpack200.exe 2010/7/19 11:56 
四 tnameserv.exe 2010/7/19 11:56 


| servertool.exe 2010/7/19 11:56 


组 垩 型 


pT 
0 性 


[a serialver.exe 2010/7/19 11:56 
四 schemagen.exe 2010/7/19 11:56 


! rmiregistry.exe 2010/7/19 11:56 


a rmid.exe 2010/7/19 11;56 
LJ 


ep 


酷 师 了 梧 


一 
站 


ln rmic.exe 2010/7/19 11:56 


| 
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盟 : 
na 





因 旭 居 因 间 闫 闫 关 问 间 关 


EE 
弓 
ri 


明明 归 邢 
Mg | 
禺 导 和 和 和 


四 3 policytool,exe 2010/7/19 11:56 
[名 packager.exe 2010/7/19 11:56 


} 
由 
山 





图 4-1 Sun JDK 中 的 工具 目录 


说 起 JDK 的 工具 ， 比 较 细心 的 读者 ， 可 能 会 注意 到 这 些 工具 的 程序 
体积 都 异常 小 巧 。 假 如 以 前 没 注意 到 ， 现 在 不 妨 再 看 看 图 4-1 中 的 最 后 
一 列 “ 大 小 ”， 几 乎 所 有 工具 的 体积 基本 上 都 稳定 在 27KB 左 右 。 并 非 JDK 
开发 团队 刻意 把 它们 制作 得 如 此 精炼 来 炫耀 编程 水 平 ， 而 是 因为 这 些 命 
令 行 工具 大 多 数 是 jdk/lib/tools.jar 类 库 的 一 层 薄 包装 而 已 ， 它 们 主要 的 功 
能 代码 是 在 tools 类 库 中 实现 的 。 读 者 把 图 4-1 和 图 4-2 两 张 图 片 对 比 一 下 
就 可 以 看 得 很 清楚 。 














假如 读者 使 用 的 是 Linux 版 本 的 JDK， 还 会 发 现 这 些 工具 中 很 多 其 


至 就 是 由 Shell 脚 本 直接 写成 的 ， 可 以 用 vim 直 接 打 开 它 们 。 


JDK 开 发 团队 选择 采用 Java 代 码 来 实现 这 些 监 控 工 具 是 有 特别 用 总 
的 : 当 应 用 程序 部 车 到 生产 环境 后 ， 无 论 是 直接 接触 物理 服务 器 还 是 远 
程 Telnet 到 服务 器 上 都 可 能 会 受到 限制 。 借 助 tools.jar 类 库 里 面 的 接口 ， 
我 们 可 以 直接 在 应 用 程序 中 实现 功能 强大 的 监控 分 析 功 能 局 。 








; 国 =: tools. jar\sun\tools - ZIP 上 讨 缩 交 件 ， 解 包 大 小 为 11 923, 2 
收 改 时 间 | 


0 Folder 201079715 
attach Folder 201079715 
,hprof Folder 2010/9/15 
jjar Fol der 201079715 
局 j ava 了 Folder 2z01079715 
| javac Folder 2010/97/15 
| javap Folder 201079715 
册 Jinfo Folder 201079/15 
,jmap Folder 2010797/15 
) jps Folder 201079715 
, j stack Folder 201079715 
品 jstat Folder 2010/9/15 
凡 jstatd Folder 2010/9/15 
Dnative2ascil Folder 201079715 
serialver Folder 201079715 
tree Folder 201079/15 
util Folder 2010/9/15 








图 4-2 tools.jat 包 的 内 部 状况 





需要 特别 说 明 的 是 ， 本 章 介 绍 的 工具 全 部 基于 Windows 平 台 下 的 
JDK 1.6 Update 21， 如 果 JDK 版 本 、 操 作 系 统 不 同 ， 工 具 所 支持 的 功能 
可 能 会 有 较 大 差别 。 大 部 分 工具 在 JDK 1.5 中 就 已 经 提供 ， 但 为 了 避免 
运行 环境 市 来 的 差异 和 兼容 性 问题 ， 建 议 读者 使 用 JDK 1.6 来 验证 本 章 
介绍 的 内 容 ， 因 为 JDK 1.6 的 工具 可 以 正常 兼容 运行 于 JDK 1.5 的 虚拟 机 
之 上 的 程序 ， 反 之 则 不 一 定 。 表 4-1 中 说 明了 JDK 主 要 命令 行 监控 工具 的 




















注意 ”如 果 读 者 在 工作 中 需要 监控 运行 于 JDK 1.5 的 虚拟 机 之 上 的 
程序 ， 在 程序 启动 时 请 添加 参数 "-Dcom.sun.management.jmxremote" 开 启 
JMX 管 理 功 能 ， 侣 则 由 于 部 分 工具 都 是 基于 JMX (包括 4.3 市 介绍 的 可 
视 化 工具 ) ， 它 们 都 将 会 无 法 使 用 ， 如 果 被 监控 程序 运行 于 JDK 1.6 的 
虚拟 机 之 上 ， 那 JMX 管 理 默认 是 开启 的 ， 虚 拟 机 启动 时 无 须 再 添加 任何 
参数 。 











表 4-1 Sun JDK 监控 和 故障 处 理工 具 




















名 称 主要 作用 
jps JVM Process Status Tool， 显 示 指 定 系统 内 所 有 的 HotSpot 虚拟 机 进程 
jstat | JVM Statistics Monitoring Tool， 用 于 收集 和 虚拟 机 各 方面 的 运行 数据 
jinfo | Configuration Info for Java， 显 示 虚 拟 机 配置 信 
( 续 ) 
名 称 主要 作用 
jmap Memory Map for Java， 生 成 虚拟 机 的 内 存 转 储 快照 (heapdump 文件 ) 




















JVM Heap Dump Browser， 用 于 分 析 heapdump 文件 ， 它 会 建立 一 个 HTTP/HTML 服 
务 器 ， 让 用 户 可 以 在 浏览 器 上 二 分 析 结 果 


Stack Trace for Java， 显 示 虚 拟 机 的 线程 快照 


jhat 





jstack 





4.2.1 jps: 虚拟 机 进程 状况 工具 





JDK 的 很 多 小 工具 的 名 字 都 参考 UNIX 命令 的 命名 方式 ， 
jps〈JVM Process Status Tool) 是 其 中 的 典型 。 除 了 名 字 像 UNIX 的 ps 命 
令 之 外 ， 它 的 功能 也 和 ps 命令 类 似 ， 可 以 列 出 正在 运行 的 虚拟 机 进程 ， 
并 显示 虚拟 机 执行 主 类 (Main Class,main() 函 数 所 在 的 类 ) 名 称 以 及 这 
些 进程 的 本 地 虚拟 机 唯一 ID (Local Virtual Machine 
Identifier,LVMID〉。 虽 然 功 能 比较 单一 ， 但 它 是 使 用 频率 最 高 的 JDK 命 
令 行 工具 ， 因 为 其 他 的 JDK 工 具 大 多 需要 输入 它 查 询 到 的 LYMID 来 确定 
要 监控 的 是 哪 一 个 虚拟 机 进程 。 对 于 本 地 虚拟 机 进程 来 说 ，LVMID 与 
操作 系统 的 进程 ID (Process Identifier,PID〉 是 一 致 的 ， 使 用 Windows 的 
任务 管理 器 或 者 UNIX 的 ps 命令 也 可 以 查询 到 虚拟 机 进程 的 LVMID， 但 
如 果 同 时 启动 了 多 个 虚拟 机 进程 ， 无 法 根据 进程 名 称 定位 时 ， 那 就 只 能 


依赖 jps 命 令 显示 主 类 的 功能 才能 区 分 了 。 











jps 命 令 格式 : 





jps[options] [hostidj] 





jps 执 行 样 例 : 





D: \Develop\Java\jdk1.6.0 21\bin>jps-1 

2388 D:\Develop\glassfish\bin\..\modules\admin-cli.jar 
2764 com.sun.enterprise.glassfish.bootstrap.ASMain 
3788 sun.tools.jps.Jps 




















jps 可 以 通过 RMI 协 议 查 询 开启 了 RMI 服 务 的 远程 虚拟 机 进程 状态 ， 
hostid 为 RMI 注 册 表 中 注册 的 主机 名 。jps 的 其 他 常用 选项 见 表 4-2。 


表 4-2 jps 工具 主要 选项 














作 
只 输出 LVMID， 省 略 主 类 的 名 称 
输出 虚拟 机 进程 启动 时 传递 给 主 类 main() 函数 的 参数 
输出 主 类 的 全 名 ， 如 果 进 程 执行 的 是 Jar 包 ， 和 输出 Jar 路 径 
输出 虚拟 机 进程 启动 时 JVM 参数 


用 











[llhttp:/ /download.oracle.com/javase/6/docs/technotes/tools/index.html。 
[2]tools.jar 中 的 类 库 不 属于 Java 的 标准 API， 如 果 引 入 这 个 类 库 ， 就 意味 
有 有 用 户 的 程序 只 能 运行 于 Sun Hotspot (或 一 些 从 Sun 公 司 购买 了 JDK 的 
源码 License 的 虚拟 机 ， 如 IBM J9、BEA JRockit) 上 面 ， 或 者 在 部 署 程序 
时 需要 一 起 部 署 tools.jat。 





4.2.2 jstat: 虚拟 机 统计 信息 监视 工具 


jstat (JVM Statistics Monitoring Tool) 是 用 于 监视 虚拟 机 各 种 运行 
状态 信息 的 命令 行 工 具 。 它 可 以 显示 本 地 或 者 远程 中 虚拟 机 进程 中 的 类 
装载 、 内 存 、 垃 圾 收集 、JIT 编 译 等 运行 数据 ， 在 没有 GUI 图 形 界面 ， 只 
提供 了 纯 文本 控制 台 环境 的 服务 器 上 ， 它 将 是 运行 期 定位 虚拟 机 性 能 问 
题 的 首选 工具 。 











jstat 命 令 格式 为 : 








jstat[loption vmid[interval[s|lms] [count]]] 





对 于 命令 格式 中 的 VMID 与 LVMID 需 要 特别 说 明 一 下 : 如 果 是 本 地 
虚拟 机 进程 ，VMID 与 LYMID 是 一 臻 的， 如果 是 远程 虚拟 机 进程 ， 那 
VMID 的 格式 应 当 是 : 





[protocol:][//llvmid[@hostname[:port]l/servernamel] 





参数 interval 和 count 代 表 查 询 间 隔 和 和 次数， 如 果 省 略 这 两 个 参数 ， 
说 明 只 查询 一 次 。 假 设 需要 每 250 毫 秒 查 询 一 次 进程 2764 垃 圾 收集 状 











jstat-gc 2764 250 20 








选项 option 代 表 独 用 户 希 望 碍 询 的 虚拟 机 信息 ， 主 要 分 为 3 类 : 类 效 


载 、 垃 圾 收集 、 
述 。 


运行 期 编译 状况， 具体 选项 及 作用 请 参考 表 4-3 中 的 描 


表 4-3 jstat 工具 主要 选项 











选 项 作 用 

-Class 监视 类 装载 、 印 载 数 量 、 总 空间 以 及 类 装载 所 耗费 的 时 间 
监视 Java 推 状况 ， 包 括 Eden 区 、 两 个 survivor 区 、 老 年 代 、 永 久 代 等 的 容量 、 已 用 空 

jy 间 、GC 时 间 合 计 等 信息 
-gccapacity 监视 内 容 与 -gc 基本 相同 ， 但 输出 主要 关注 Java 堆 各 个 区 域 使 用 到 的 最 大 、 最 小 空间 
-gcutil 监视 内 容 与 -gc 基本 相同 ， 但 输出 主要 关注 已 使 用 空间 占 总 空间 的 百分比 
-gccause 与 -gcutil 功能 一 样 ， 但 是 会 额外 输出 导致 上 一 次 GC 产生 的 原因 
-gcnew 监视 新 生 代 GC 状况 





-gcnewcapacity 


-gcold 


监视 内 容 与 - gcnew 基本 相同 ， 输 出 主要 关注 使 用 到 的 最 大 、 最 小 空间 
监视 老年 代 GC 状况 





-gcoldcapacity 


-gcpermcapacity 


监视 内 容 与 - gcold 基本 相同 ， 输 出 主要 关注 使 用 到 的 最 大 、 最 小 空间 
输出 永久 代 使 用 到 的 最 大 、 最 小 空间 





-compiler 


-printcompilation 


输出 JIT 编译 器 编译 过 的 方法 、 耗 时 等 信息 
输出 已 经 被 JIT 编译 的 方法 





jstat 监 视 选 项 众多 ， 团 于 版 面 原因 无 法 逐一 演示 ， 这 里 仅 举 监视 一 
人 台 刚 刚 局 动 的 GlassFish v3 服务 器 的 内 存 状 况 的 例子 来 演示 如 何 查 看 监视 
结果 。 监 视 参 数 与 输出 结果 如 代码 清单 4-1 所 示 。 


代码 清单 4-1 jstat 执 行 样 例 





D: \Develop\Java\jdk1.6.0 21\bin>jstat-gcutil 2764 
SO0 SL EO P YGC YGCT FGC FGCT GCT 
0.00 0.00 6.20 41.42 47.20 16 0.105 3 0.472 0.577 








查询 结果 表明 : 这 人 台 服 务 器 的 新 生 代 Eden 区 (E， 表 示 Eden) 使 用 


了 6.2% 的 空间 ， 两 个 Survivor 区 (S0、S1， 表 示 Survivor0、Survivor1) 
里 面 都 是 空 的 ， 老 年 代 0， 表示 Old) 和 永久 代 (P， 表 示 Permanent) 
则 分 别 使 用 了 41.42% 和 47.20% 的 空间 。 程 序 运行 以 来 共 发 生 Minor 

GC (YGC， 表 示 Young GC) 16 次 ， 总 耗 时 0.105 秒 ， 发 生 Full 





GC (FGC， 表 示 Full GC) 3 次 ，Full GC 总 耗 时 (FGCT， 表 示 Full GC 
Time)〉 为 0.472 秒 ， 所 有 GC 总 耗 时 (GCT， 表 示 GC Time) 为 0.577 秒 。 





使 用 jstat 工 具 在 纯 文本 状态 下 监视 虚拟 机 状态 的 变化 ， 确 实 不 如 后 
面 将 会 提 到 的 VisualVM 等 可 视 化 的 监视 工具 直接 以 图 表 展 现 那 样 直 
观 。 但 许多 服务 器 管理 员 都 习惯 了 在 文本 控制 台中 工作 ， 和 直接 在 控制 台 
中 使 用 jstat 命 令 依 然 是 一 种 常用 的 监控 方式 。 


[1 需要 远程 主机 提供 RMI 支 持 ，Sun 提 供 的 jstatd 工 具 可 以 很 方便 地 建立 


远程 RMI 服 务 器 。 





4.2.3 jinfo: Java 配 置信 息 工 具 


jinfo (Configuration Info for Java) 的 作用 是 实时 地 查看 和 调整 虚拟 
机 各 项 参数 。 使 用 jps 命 令 的 -v 参 数 可 以 查看 虚拟 机 启动 时 显 式 指定 的 参 
数列 表 ， 但 如 果 想 知道 未 被 显 式 指定 的 参数 的 系统 默认 值 ， 除 了 去 找 资 
料 外 ， 就 只 能 使 用 jinfo 的 -flag 选 项 进行 查询 了 《如 采 只 限于 JDK 1.6 或 以 
上 版 本 的 话 ， 使 用 java-XX:+PrintFlagsFinal 查 看 参数 默认 值 也 是 一 个 很 
好 的 选择 ) ，jinfo 还 可 以 使 用 -sysprops 选 项 把 虚拟 机 进程 的 
System.getProperties() 的 内 容 打 印 出 来 。 这 个 命令 在 JDK 1.5 时 期 已 经 随 
着 Linux 版 的 JDK 发 布 ， 当 时 只 提供 了 信息 查询 的 功能 ，JDK 1.6 之 后 ， 
jinfo 在 Windows 和 Linux 平 台 都 有 提供 ， 并 且 加 入 了 运行 期 修改 参数 的 能 
力 ， 可 以 使 用 -flag[+|-]name 或 者 -flag name=value 修 改 一 部 分 运行 期 可 写 
的 虚拟 机 参数 值 。JDK 1.6 中 ，jinfo 对 于 Windows 平 台 功 能 仍然 有 较 大 限 
制 ， 只 提供 了 最 基本 的 -flag 选 项 。 








jinfo 命 令 格式 : 








Jinfoloption]pid 





执行 样 例 : 查询 CMSInitiatingOccupancyFraction 参 数值 。 

















C:\>jinfo-flag CMSInitiatingOccupancyFraction 1444 
-XX:CMSInitiatingOccupancyFraction=85 











4.2.4 ”jmap: Java 内 存 映 像 工 具 


jmap (Memory Map for Java) 命令 用 于 生成 堆 转 储 快照 (一 般 称 为 
heapdump 或 dump 文 件 ) 。 如 果 不 使 用 jmap 命 令 ， 要 想 获取 Java 堆 转 储 
快照 ， 还 有 一 些 比 较 “ 芭 力 ”的 手段 ， 壁 如 在 第 2 章 中 用 过 的 - 
XX:+HeapDumpOnOutOfMemoryError 参 数 ， 可 以 让 虚拟 机 在 OOM 异 常 
出 现 之 后 自动 生成 damp 文 件 ， 通 过 -XX:+HeapDumpOnCtrlBreak 参 数 则 
可 以 使 用 [Ctrl]+[Break] 键 让 虚拟 机 生成 dqmp 文 件 ， 又 或 者 在 Linux 系 统 
下 通过 Kill-3 命 令 发 送 进程 退出 信号 “ 吓 晓 ”一 下 虚拟 机 ， 也 能 拿 到 dump 
文件 








jmap 的 作用 并 不 仅仅 是 为 了 获取 dump 文 件 ， 它 还 可 以 查询 finalize 
执行 队列 、Java 扒 和 永久 代 的 详细 信息 ， 如 空间 使 用 率 、 当 前 用 的 是 哪 
种 收集 器 等 。 





和 jinfo 命 令 一 样 ，jmap 有 不 少 功能 在 Windows 平 台 下 都 是 受 限 的 ， 
除了 生成 dump 文 件 的 -dump 选 项 和 用 于 查看 每 个 类 的 实例 、 空 间 占 用 统 
计 的 -histo 选 项 在 所 有 操作 系统 都 提供 之 外 ， 其 余 选 项 都 只 能 在 
Linux/Solaris 下 使 用 。 


jmap 命 令 格式 : 





jmap [option]vmid 








option 选 项 的 合法 值 与 具体 含义 见 表 4-4。 


表 4-4 jmap 工具 主要 选项 
选 项 作 村 


生成 Java 堆 转 储 快照 。 格 式 为 : -dump:[live，]format=b，file=<filename>， 
其 中 live 子 参 数 说 明 是 否 只 dump 出 存活 的 对 象 
显示 在 F-Queue 中 等 待 Finalizer 线程 执行 finalize 方法 的 对 象 。 只 


-dump 





nes 在 Linux / Solaris 平台 下 有 效 
i 显示 Java 推 详 细 信 息 ， 如 使 用 哪 种 回收 器 、 参 数 配 置 、 分 代 状 况 
-hea 


等 。 只 在 Linux / Solaris 平台 下 有 效 

-histo 显示 堆 中 对 象 统计 信息 ， 包 括 类 、 实 例 数量 、 合 计 容 量 

以 ClassLoader 为 统计 口径 显示 永久 代 内 存 状 态 。 只 在 Linux / 
Solaris 平台 下 有 效 

| 当 虚 拟 机 进程 对 -dump 选项 没有 响应 时 ， 可 使 用 这 个 选项 强制 生成 

dump 快照 。 只 在 Linux / Solaris 平台 下 有 效 








-permstat 








代码 清单 4- ee 个 正在 运行 的 Eclipse 的 dump 快 照 文 
件 的 例子 ， 例 子 中 的 3500 是 通过 jps 命 令 查询 到 的 LVMID 。 


代码 清单 4-2 使 用 jmap 生 成 dump 文 件 











C:\Users\IcyFenix>jmap-dump:format=b,file=eclipse.bin 3500 
Dumping heap to C:\Users\IcyFenix\eclipse.bin 
Heap dump file created 








4.2.5 jhat: 虚拟 机 堆 转 储 快照 分 析 工 具 


Sun JDK 提 供 jhat (JVM Heap Analysis Tool) 命令 与 jmap 搭 配 使 
用 ， 来 分 析 jmap 生 成 的 堆 转 储 快照 。jhat 内 置 了 一 个 微型 的 HTTP/HTML 
服务 器 ， 生 成 dump 文 件 的 分 析 结 果 后 ， 可 以 在 浏览 器 中 查看。 不 过 实 
事 求 是 地 说 ， 在 实际 工作 中 ， 除 非 笔者 手 上 真 的 没有 别 的 工具 可 用 ， 否 
则 一 般 都 不 会 去 直接 使 用 jhat 命 令 来 分 析 dump 文 件 ， 主 要 原因 有 二 : 一 
是 一 般 不 会 在 部 署 应 用 程序 的 服务 器 上 直接 分 析 dump 文 件 ， 即 使 可 以 
这 样 做 ， 也 会 尽量 将 dump 文 件 复制 到 其 他 机 器 由 上 进行 分 析 ， 因 为 分 析 
工作 是 一 个 耗 时 而 且 消 耗 硬 件 资 源 的 过 程 ， 既 然 都 要 在 其 他 机 器 进行 ， 
就 没有 必要 受到 命令 行 工具 的 限制 了 ;， 另 一 个 原因 是 jhat 的 分 析 功 能 相 
对 来 说 比较 简陋 ， 后 文 将 会 介绍 到 的 VisualVM， 以 及 专业 用 于 分 析 
dump 文 件 的 Eclipse Memory Analyzer、IBM HeapAnalyzerl ”| 等 工具 ， 都 
能 实现 比 jhat 更 强大 更 专业 的 分 析 功 能 。 代 码 清单 4-3 演 示 了 使 用 jhat 分 
析 4.2.4 节 中 采用 jmap 生 成 的 Eclipse IDE 的 内 存 快 照 文件 。 








代码 清单 4-3 ”使 用 jhat 分 析 dump 文 件 








C:\Users\IcyFenix~>jhat eclipse.bin 

Reading from eclipse.bin..... 

Dump file created Fri Nov 19 22:07:21 CST 2010 
Snapshot read,resolving..... 

Resolving 1225951 objects...... 

Chasing references,expect 245 dots...... 
Eliminating duplicate references...... 

Snapshot resolved. 


























Started HTTP server on port 7000 
Server is ready. 





屏幕 显示 "Server is ready." 的 提示 后 ， 用 户 在 浏览 器 中 键入 
http:/localhost:7000/ 就 可 以 看 到 分 析 结 果 ， 如 图 4-3 所 示 。 


Ail Classes excluding platform) ~ Windows Internet Exzplozer 


©SO |B) htip /i/localhost: T7000) 
请 收藏 夫 芒 和 1 0asses (exeluding platf.,. 入 ~ 加 > 本 由 ”页 面 f) 安全 G)、 工 只 0)v 本 - 拒 似 同 全 








Package org. osgi. service. url 


.bsgi. service. url. AbstractURLStreamHandlerServyice [0x5fde8a8] 
.Osgi. service. url. URLStreamHandlerService [0x5fdd868] 
class org. osgi. service. url. URLStreamHandlerSetter [0x716f858] 


Package org. osgi. util. tracker 


,Osgi. util. tracker. AbstractTracked [0x5e73888] 
class org. osgi. util. tracker. ServiceTracker [0x5e702a0] 
class org, osgi. util. tracker. ServiceTracker$l [0x5fb3a50] 
] ,OSEi, util. tracker, ServiceTracker$AllTracked [Ox5e74090] 
class org. osgi. util. tracker. ServiceTracker}d Tracked [0x5e73c58] 


class org, osgi, util, tracker, ServiceTrackerCustomizer [0x5d2a428] 





Other Queries 


All classes including platform 

Show all members of the rootset 

Show instance counts for all classes (ipcluding platform) 
Show instance counts for all classes (excluding platform) 
Show heap histogram 

Show finalizer summary 

Execute Object Query Language {OQL) query 


证 











图 4-3 jhat 的 分 析 结 果 


分 析 结 果 默 认 是 以 包 为 单位 进行 分 组 显示 ， 分 析 内 存 汇 漏 问 题 主 要 
会 使 用 到 其 中 的 "Heap Histogram" (与 jmap-histo 功 能 一 样 ) 与 OQL 页 签 
的 功能 ， 前 者 可 以 找到 内 存 中 总 容量 最 大 的 对 象 ， 后 者 是 标准 的 对 象 查 











询 语 言 ， 使 用 类 似 SQL 的 语法 对 内 存 中 的 对 象 进行 查询 统计 ， 读 者 若 对 
OQL 有 兴趣 的 话 ， 可 以 参考 本 书 附录 D 的 介绍 。 


四 用 于 分 析 的 机 器 一 般 也 是 服务 器 ， 由 于 加 载 dump 快 照 文件 需要 比 生 
成 damp 更 大 的 内 存 ， 所 以 一 般 在 64 位 JDK、 大 内 存 的 服务 器 上 进行 。 
[2IBM HeapAnalyzer 用 于 分 析 IBM J9 虚 拟 机 生成 的 映像 文件 ， 各 个 虚拟 
机 产生 的 映像 文件 格式 并 不 一 致 ， 所 以 分 析 工 具 也 不 能 通用 。 


4.2.6 jstack: Java 扒 栈 跟 踪 工 具 


jstack 〈Stack Trace for Java) 命令 用 于 生成 虚拟 机 当前 时 刻 的 线程 
快照 (一般 称 为 thbreaddump 或 者 javacore 文 件 ) 。 线 程 快照 就 是 当前 虚拟 
机 内 每 一 条 线程 正在 执行 的 方法 堆栈 的 集合 ， 生 成 线程 快照 的 主要 目的 
是 定位 线程 出 现 长 时 间 停 顿 的 原因 ， 如 线程 间 死 锁 、 死 循环 、 请 求 外 部 
资源 导致 的 长 时 间 等 待 等 都 是 导致 线程 长 时 间 停 顿 的 常见 原因 。 线 程 出 
现 停顿 的 时 候 通 过 jstack 来 查看 各 个 线程 的 调用 堆栈 ， 就 可 以 知道 没有 
响应 的 线程 到 底 在 后 台 做 些 什 么 事情 ， 或 者 等 待 着 什么 资源 。 








jstack 命 令 格 式 : 





jstackloption]vmid 





option 选 项 的 合法 值 与 具体 含义 见 表 4-5。 





表 4-5 jstack 工具 主要 选项 
选 项 作 用 
-F | 当 正 常 输出 的 请 求 不 被 响应 时 ， 强 制 输出 线程 堆栈 
| 除 堆栈 外 ， 显 示 关 于 锁 的 附加 信息 
如 果 调 用 到 本 地 方法 的 话 ， 可 以 显示 CiC++ 的 堆栈 











代码 清单 4-4 是 使 用 jstack 查 看 Eclipse 线 程 堆 栈 的 例子 ， 例 子 中 的 
3500 是 通过 jps 命 令 查 询 到 的 LVMID。 


代码 清单 4-4 ”使 用 jstack 但 看 线程 堆栈 (部 分 结果 ) 


C:\Users\IcyFenix~>jstack-l1 3500 

2010-11-19 23:11;286 

Full thread dump Java HotSpot (TM) 64-Bit Server VM (17.1-b03 mixed 
mode) : 

"[ThreadPool Manager]-Idle Thread"daemon prio=6 
tid=0x0000000039gdqd4000 nid=0xf50 in Object.wait() [0x000000003c96f000] 

java.lang.Thread.State:WAITING (on object monitor) 

at java.lang.Object.wait (Native Method) 

-waiting on<0x0000000016bdcc60>> (a 
org.eclipse.equinox.internal.util.impl.tpt.threadpool .Executor) 
at java.lang.Object.wait (Object.java:485) 

at 
org.eclipse.equinox.internal.util.impl.tpt.threadpool .Executor .run (Ex 

-1ockedq<0x0000000016bqcc60> (a 
org.eclipse.equinox.internal.util.impl.tpt.threadpool .Executor) 

Locked ownable synchronizers: 

-None 











































































































在 JDK 1.5 中 ，java.lang.Thread 类 新 增 了 一 个 getAllStackTraces() 方 法 
用 于 获取 虚拟 机 中 所 有 线程 的 StackTraceElement 对 象 。 使 用 这 个 方法 可 
以 通过 简单 的 几 行 代码 i 在 实际 项 目 中 不 妨 
调用 这 个 方法 做 个 管理 员 页 面 ， 可 以 随时 使 用 浏览 器 来 查看 线程 堆栈 ， 
如 代码 清单 4-5 所 示 ， 这 是 笔者 的 一 个 小 经 验 。 








代码 清单 4-5 ”查看 线程 状况 的 JSP 页 面 





~<s@page import="java.util.Map"%$> 

<html> 

<nhnead> 

三 title 之 服务 器 线程 信息 </title>> 

</head>> 

<body> 

<pre> 

=%$ 

for (Map.Entry<Thread, StackTraceElement []>stackTrace:Thread. 
getAllStackTraces () .entrySet ()) { 

Thread thread= (Thread) stackTrace.getrKey (); 
StackTraceElement[]stack= (StackTraceElement[]) 





























stackTrace.getValue (); 

if (thread.equals (Thread.currentThread()) ) { 
continue; 

} 

out .print ("\n 线 程 :"+thread.getName ()+"\n"); 
for (StackTraceElement element:stack) { 
out.print ("\t"+element+"\n").; 

















</pre> 
</pody> 
</html> 


ee | 


4.2.7 HSDIS: JIT 生 成 代码 反 汇 编 


在 Java 虚 拟 机 规范 中 ， 详 细 描 述 了 虚拟 机 指令 集中 每 条 指令 的 执行 
过 程 、 执 行 前 后 对 操作 数 栈 、 局 部 变量 表 的 影响 等 细节 。 这 些 细节 描述 
与 Sun 的 早期 虚拟 机 (Sun Classic VM) 高 度 吻 合 ， 但 随 着 技术 的 发 展 ， 
高 性 能 虚拟 机 真正 的 细节 实现 方式 已 经 渐渐 与 虚拟 机 规范 所 描述 的 内 容 
产生 了 越 来 越 大 的 差距 ， 虚 拟 机 规范 中 的 描述 逐渐 成 了 虚拟 机 实现 
的 “概念 模型 "> 一 一 即 实现 只 能 保证 规范 描述 等 效 。 基 于 这 个 原因 ， 我 们 
分 析 程 序 的 执行 语义 问题 (虚拟 机 做 了 什么 时 ， 在 字 节 码 层面 上 分 析 
完全 可 行 ， 但 分 析 程 序 的 执行 行为 问题 (虚拟 机 是 怎样 做 的 、 性 能 如 
何 ) 时， 在 字 节 码 层面 上 分 析 就 没有 什么 意义 了 ， 需 要 通过 其 他 方式 解 
决 。 

















分 析 程 序 如 何 执行 ， 通 过 软件 调试 工具 (GDB、Windbg 等 ) 来 断 
点 调试 是 最 常见 的 手段 ， 但 是 这 样 的 调试 方式 在 Java 虚 拟 机 中 会 遇 到 很 
大 困难 ， 因 为 大 量 执行 代码 是 通过 JIT 编 译 器 动态 生成 到 CodeBuffer 中 
的 ， 没 有 很 简单 的 手段 来 处 理 这 种 混合 模式 的 调试 〈 不 过 相信 虚拟 机 开 
发 团队 内 部 肯定 是 有 内 部 工具 的 ) 。 因 此 ， 不 得 不 通过 一 些 特别 的 手段 
来 解决 问题 ， 基 于 这 种 背景 ， 本 节 的 主角 一 一 HSDIS 插 件 就 正式 登场 
Ts 

















HSDIS 是 一 个 Sun 官 方 推荐 的 HotSpot 虚 拟 机 JIT 编 译 代码 的 反 汇 编 插 
件 ， 它 包含 在 HotSpot 虚 拟 机 的 源码 之 中 ， 但 没有 提供 编译 后 的 程序 。 
在 Project Kenai 的 网 站 凯 也 可 以 下 载 到 单独 的 源码 。 它 的 作用 是 让 
HotSpot 的 -XX:+PrintAssembly 指 令 调用 它 来 把 动态 生成 的 本 地 代码 还 原 
为 汇编 代码 输出 ， 同 时 还 生成 了 大 量 非 常 有 价值 的 注释 ， 这 样 我 们 就 可 
以 通过 输出 的 代码 来 分 析 问 题 。 读 者 可 以 根据 自己 的 操作 系统 和 CPU 类 
型 从 Project Kenai 的 网 站 上 下 载 编译 好 的 插件 ， 直 接 放 到 
JDK_HOME/jre/bin/client 和 JDK_HOME/jre/bin/server 目 录 中 即 可 。 如 果 
没有 找到 所 需 操作 系统 〈 璧 如 Windows 的 就 没有 ) 的 成 品 ， 那 就 得 自己 
使 用 源码 编译 一 下 上 中。 

















还 需要 注意 的 是 ， 如 果 读 者 使 用 的 是 Debug 或 者 FastDebug 版 的 
HotSpot， 那 可 以 直接 通过 -XX:+PrintAssembly 指 令 使 用 插件 ， 如 果 使 用 
的 是 Product 版 的 HotSpot， 那 还 要 额外 加 入 一 个 - 
XX:+UnlockDiagnosticVMOptions 参 数 。 笔 者 以 代码 清单 4-6 中 的 简单 测 
试 代码 为 例 演示 一 下 这 个 插件 的 使 用 。 


代码 清单 4-6 测试 代码 








public class Bart{ 

int a=1; 

static int b=2; 

public int sum (int c) 1 

return at+b+c; 

} 

public static void main (String[]args) 1 
new Bar() .sum (3) ; 














编译 这 段 代 码 ， 并 使 用 以 下 命令 执行 。 





java-XX:+PrintAssembly-Xcomp-XX:CompileCommand=dontinline, 
*Bar.sum-XX:Compi leCommand=compileonly, *Bar.sum test.Bar 

















其 中 ， 参 数 -Xcomp 是 让 虚拟 机 以 编译 模式 执行 代码 ， 这 样 代码 可 
以 “偷懒 "， 不 需要 执行 足够 次 数 来 预 热 就 能 触发 IT 编 译 趾 。 两 个 - 
XX:CompileCommand 意 思 是 让 编译 器 不 要 内 联 sum() 并 且 只 编译 
sum()，-XX:+PrintAssembly 就 是 输出 反 汇编 内 容 。 如 果 一 切 顺利 的 话 ， 
那么 屏幕 上 会 出 现 类 似 下 面 代码 清单 4-7 所 示 的 内 容 。 





代码 清单 4-7 测试 代码 








[Disassembling for mach="'i386'] 
[Entry Point] 
[Constants] 
#{method}'sum'' (I) I'in'test/Bar' 
#this:ecx='test/Bar' 

#parm0 :edx=int 

#[sp+0x20] (sp of caller) 





























0x01cac407:cmp 0x4 (Secx) ， Seax 
Ox0lcac40a:jne 0x01lc6b050; {runtime call} 
[Verified Entry Point] 

0x01cac410 :mov%eax, -0x8000 (Sesp) 
0x0lcac417 :push%ebp 

Ox0lcac418:sub$0x18, %esp; *aload 0 

; -test.Bar:sume0 (line 8) 

; block BO[O0O, 10] 
0x01cac41b:mov 0x8 (Secx) ， Seax; *getfield a 
; -test.Bar:sumel (line 8) 
0x0lcac4le:mov$0x3d2fad8, Sesi; {oop (a 






























































'java/lang/Class'='test/Bar') } 

Ox0lcac423:mov 0x68 (Sesi) ， Sesi; *getstatic b 
; -test.Bar:sume4 (line 8) 

0x0lcac426:add%esi, Seax 

0x0lcac428:add%sedx, Seax 

0x0lcac42a:add$0x18, %Sesp 

0x0lcac42d:pop%sebp 

Ox0lcac42e:test%eax, Ox2b0100; {poll return} 
0x0lcac434:ret 

















上 段 代 码 并 不 多 ， 下 面 一 句 名 进行 说 明 。 

1) mov9%oeax，-0x8000 (%esp) : 检查 栈 溢 。 
2) push%ebp: 保存 上 一 栈 帧 基 址 。 

3) sub$0x18，%esp: 给 新 帧 分 配 空间 。 


4) mov 0x8 (%ecx) ，%eax: 取 实 例 变量 a， 这 里 0x8 〈9%ecx) 就 
是 ecx+0x8 的 意思 ， 前 面 "[Constants]" 节 中 提示 了 "this:ecx='tesVBar"， 即 
ecx 寄 存 器 中 放 的 就 是 this 对 象 的 地 址 。 偏 移 0x8 是 越过 this 对 象 的 对 象 
头 ， 之 后 就 是 实例 变量 a 的 内 存 位 置 。 这 次 是 访问 “Java 扒 ?中 的 数据 。 








5) mov$0x3d2fad8，%esi: 取 test.Bar 在 方法 区 的 指针 。 





6) mov 0x68 (%esi) ，%esi: 取 类 变量 b， 这 次 是 访问 “方法 区 ”中 
的 数据 。 


7) add%esi，%eax 和 add%edx，%eax: 做 两 次 加 法 ， 求 a+b+c 的 
值 ， 前 面 的 代码 把 a 放 在 eax 中 ， 把 b 放 在 esi 中 ， 而 c 在 [Constants] 中 提示 


了 ，"parm0:edx=int"， 说 明 c 在 edx 中 。 
8) add$0x18，%esp: 撤销 栈 帧 。 
9) pop%ebp: 恢复 上 一 栈 帧 。 
10) test%eax，0x2b0100: 轮 询 方法 返回 处 的 SafePoint。 
11) ret: 方法 返回 。 


[1]Project Kenai: http://kenai.com/projects/base-hsdis。 

DJHLLVM 圈 子 中 有 已 编译 好 的 : http://hllvm.group.iteye.com/。 
[3]-Xcomp 在 较 新 的 HotSpot 中 被 移 除 了 ， 如 果 读 者 的 虚拟 机 无 法 使 用 这 
个 参数 ， 请 加 个 循环 预 热 代码 ， 和 触发 JIT 编 译 。 


4.3 JDK 的 可 视 化 工具 


JDK 中 除了 提供 大 量 的 命令 行 工 具 外 ， 还 有 两 个 功能 强大 的 可 视 化 
工具 : JConsole 和 VisualVM， 这 两 个 工具 是 JDK 的 正式 成 员 ， 没 有 被 贴 


上 "unsupported and experimental" 的 标签 。 


其 中 JConsole 是 在 JDK 1.5 时 期 就 已 经 提供 的 虚拟 机 监控 工具 ， 而 
VisualVM 在 JDK 1.6 Update7 中 才 首 次 发 布 ， 现 在 已 经 成 为 
Sun 〈Oracle) 主力 推动 的 多 合 一 故障 处 理工 具 册 ， 并 且 已 经 从 JDK 中 分 
离 出 来 成 为 可 以 独立 发 展 的 开源 项 目 。 





为 了 避免 本 市 的 讲解 成 为 对 软件 说 明文 档 的 简单 翻译 ， 笔 者 准备 了 
一 些 代 码 样 例 ， 都 是 笔者 特意 编写 的 “反面 教材 "。 后 面 将 会 使 用 这 两 球 
工具 去 监控 、 分 析 这 几 段 代码 存在 的 问题 ， 算 是 本 节 人 简单 的 实战 分 析 。 
读者 可 以 把 在 可 视 化 工具 观察 到 的 数据 、 现 象 ， 与 前 面 两 童 中 讲解 的 理 
论 知识 互相 印证 。 





4.3.1 JConsole: Java 监 视 与 管理 控制 台 


JConsole (Java Monitoring and Management Console) 是 一 种 基于 
JMX 的 可 视 化 监视 、 管 理工 具 。 它 管理 部 分 的 功能 是 针对 JMX MBean 进 
行 管理 ， 由 于 MBean 可 以 使 用 代码 、 中 间 件 服务 器 的 管理 控制 台 或 者 所 


有 符合 JMX 规 范 的 软件 进行 访问 ， 所 以 本 市 将 会 着 重 介 绍 JConsole 监 视 
部 分 的 功能 。 

1. 启 动 JConsole 

通过 JDK/bin 目 录 下 的 "jconsole.exe" 启 动 JConsole 后 ， 将 自动 搜索 出 
本 机 运行 的 所 有 虚拟 机 进程 ， 不 需要 用 户 自 己 再 使 用 jps 来 查询 了 ， 如 图 


4-4 所 示 。 双 击 选择 其 中 一 个 进程 即 可 开始 监控 ， 也 可 以 使 用 下 面 的 “ 远 
程 进程 "功能 来 连接 远程 服务 器 ， 对 远程 虚拟 机 进行 监控 。 


sun. tools. jconsole. JConsole 
org. eclipse. equinox. launcher 1.1.0.w201005... 
om, fenixsoft. monitorine. Monitorinelest 


呈 远程 进程 : 





图 4-4 JConsole 连 接 页 面 


从 图 4-4 可 以 看 出 ， 笔 者 的 机 器 现在 运行 了 Eclipse、JConsole 和 
MonitoringTest 三 个 本 地 虚拟 机 进程 ， 其 中 MonitoringTest 束 是 笔者 准备 
的 “反面 教材 ”代码 之 一 。 双 击 它 进 入 JConsole 主 界面 ， 可 以 看 到 主 界面 

共 包 括 “ 概 述 ”、“ 内 存 ”、“ 线 程 、“ 类 ”、“VM 摘 要 ”、"MBean"6 个 页 


签 ， 如 图 4-5 所 示 。 


网 Java 监视 和 管理 控制 台 - pid: 2568 com. fenixsoft. monitoring. MonitoringTest 


EJs 
SP 











时 间 范 围 : 条 部 … i 


摊 内 存 使 用 情况 
100 Wb 

80 Mb 

60 Nb 

40 Nb 

20 Mb 
0.0 Wp 


19:55 20:00 20:05 





已 使 用 : 24.2 哪 已 提交: 101.4 Itb 最 大 信 : 101.4 岂 











图 4-5 JConsole 主 界面 





“概述 ”页 签 显示 的 是 整个 虚拟 机 主要 运行 数据 的 概览 ， 其 中 包 
括 “ 堆 内 存 使 用 情况 “线程 、“ 类 ”“CPU 使 用 情况 ?4 种 信息 的 曲线 
图 ， 这 些 曲线 图 是 后 面 “ 内 存 ”“ 线 程 、“ 类 ?页 签 的 信息 汇总 ， 有 共 体 内 
容 将 在 后 面 介绍 





2. 内 存 监 控 


“内 存 ” 页 签 相当 于 可 视 化 的 jstat 命 令 ， 用 于 监视 受 收集 器 管理 的 虚 
拟 机 内 存 (Java 堆 和 永久 代 〉 的 变化 趋势 。 我 们 通过 运行 代码 清单 4-8 中 
的 代码 来 体验 一 下 它 的 监视 功能 。 运 行 时 设置 的 虚拟 机 参数 为 : 
Xms100m-Xmx100m-XX:+UseSerialGC， 这 段 代码 的 作用 是 以 64KB/50 
室 秒 的 速度 往 Java 扒 中 填充 数据 ， 一 共 填 充 1000 次 ， 使 用 JConsole 的 “内 
存 ” 页 签 进行 监视 ， 观 察 曲 线 和 柱状 指示 图 的 变化 。 





代码 清单 4-8 ”JConsole 监 视 代码 





大 大 


* 内 存 占 位 符 对 象 ， 一 个 00MObject 大 约 占 64KB 
*7 

static class OOMObJjectf{ 

public byte[llplaceholder=new byte[64*1024]; 
} 
public static void fillHeap (int num) throws InterruptedExceptiont 
List<OOMObject~>1list=new ArrayList<OOMObject> (); 

for (int i=0; i<num; i++) { 

// 稍 作 延 时 ， 令 监视 曲线 的 变化 更 加 明显 

Thread.sleep (50) ; 

list.add (new OOMObJject() ) ; 

} 
System.gc (); 

} 

public static void main (String[]args) throws Exceptiont{ 
fillHeap (1000); 

} 






























































程序 运行 后 ， 在 “内 存 ” 页 签 中 可 以 看 到 内 存 池 Eden 区 的 运行 趋势 呈 
现 折线 状 ， 如 图 4-6 所 示 。 而 监视 范围 扩大 至 整个 堆 后 ， 会 发 现 曲线 是 
一 条 向 上 增长 的 平滑 曲线 。 并 且 从 柱状 图 可 以 看 出 ， 在 1000 次 循环 执行 
结束 ， 运 行 了 System.gcO 后 ， 虽 然 整个 新 生 代 Eden 和 Survivor 区 都 基本 





被 清空 了 ， 但 是 代表 老年 代 的 柱状 图 仍然 保持 峰值 状态 ， 说 明和 被 填充 进 
堆 中 的 数据 在 System.gc(0) 方 法 执行 之 后 仍然 存活 。 笔 者 的 分 析 到 此 为 
止 ， 现 提 两 个 小 问题 供 读者 思考 一 下 ， 答 案 稍 后 给 出 。 


1) 虚拟 机 启动 参数 只 限制 了 Java 堆 为 100MB， 没 有 指定 -Xmn 参 
数 ， 能 否 从 监控 图 中 估计 出 新 生 代 有 和 多大? 


2) 为 何 执行 了 System.gc0 之 后 ， 图 4-6 中 代表 老年 代 的 柱状 图 仍然 
显示 峰值 状态 ， 代 码 需 要 如 何 调整 才能 让 System.gcO 回 收 挥 填充 到 堆 中 
的 对 象 ? 


| 到 连接 窗口 帮助 


概述 | 内 存 | 线程 | 类 | m 摘要 中 esa 














图 表 : | 内 存 池 “Eden Space 了 | 


已 他 用 
4 1,661,592 ; 





时 间 : 2010-11-20 19:48:54 
已 使 用 : 1, 353 Kb 
分 配 : 27, 328 Kb 
最 大 值 : 27, 328 Kb 
GC 时 间 : Copy (2 项 收集 ) 所 用 的 时 间 
为 0.083 种 
MarkSweepCompact 《1 项 收集 ) 所 用 的 时 间 
为 0.054 种 








aa 














图 4-6 Eden 区 内 存 变化 状况 


问题 1 答案 :图 4-6 显 示 Eden 空 间 为 27 328KB， 因 为 没有 设置 - 
XX:SurvivorRadio 参 数 ， 所 以 Eden 与 Survivor 空 间 比 例 为 默认 值 8:1， 整 
个 新 生 代 空间 大 约 为 27 328KBx125%=34 160KB。 


问题 2 答案 : 执行 完 System.gc() 之 后 ， 空 间 未 能 回收 是 因为 List< 
OOMObject>jlist 对 象 仍然 存活 ，fllHeap(0) 方 法 仍然 没有 退出 ， 因 此 flist 
对 象 在 System.gc0 执 行 时 仍然 处 于 作用 域 之 内 号 。 如 果 把 System.gcO 移 


动 到 fillHeap0) 方 法 外 调用 就 可 以 回收 掉 全 部 内 存 。 
3. 线 程 监控 


如 果 上 面 的 “内 存 ” 页 签 相当 于 可 视 化 的 jstat 命 令 的 话 ，“ 线 程 ”页 签 
的 功能 相当 于 可 视 化 的 jstack 命 令 ， 遇 到 线程 停顿 时 可 以 使 用 这 个 页 签 
进行 监控 分 析 。 前 面 讲解 jstack 命 令 的 时 候 提 到 过 线程 长 时 间 停 顿 的 主 
要 原因 主要 有 : 等 待 外 部 资源 (数据 库 连接 、 网 络 资源 、 设 备 资 
等 ) 、 死 循环 、 锁 等 待 〈 活 锁 和 和 死 锁 ) 。 通 过 代码 清单 4-9 分 别 演 示 一 
下 这 几 种 情况 。 





代码 清单 49 ”线程 等 待 演示 代码 





/** 

* 线 程 死 循环 演示 
*/ 
public static void createBusyThread () { 
Thread thread=new Thread (new Runnable() { 
QOverride 

public void run()f{ 
while (true) // 第 41 行 





























} 

}, "testBusyThread"); 
thread.start (); 

} 

/** 

* 线 程 锁 等 待 演示 

Ff 
public static void createLockThread (final Object lock) 1 
Thread thread=new Thread (new Runnable() { 

QOverride 

public void run(){ 

synchronized (lock) 1 

tryl 


























lock.wait () ; 
}catch (I 
e.prints 
} 
} 
} 
}， 
thread.s 
} 

publ 








七 at 七 () ; 


1C S 


nterruptedqd] 
tackTrace (); 





"testLockThread") ; 


Exception e) { 


tatic void main (String[]args) throws 

















Buf 











br.readLine (); 





feredReader br=new 
InputStreamReader (System.in) ); 





Bi 





FeredReader (new 











createBusyThread () ; 


Dr .readqLine () ; 


Object obj=new Object () ; 


createLockThread (obj); 


} 








Exceptiont 


程序 运行 后 ， 首 先 在 “线程 ”页 签 中 选择 main 线 程 ， 如 图 4-7 所 示 。 


堆栈 追踪 显示 BufferedReader 在 readBytes 方 法 中 等 
入 ， 这 时 线程 为 Runnable 状 态 ，Runnable 状 态 的 线程 会 
间 ， 但 readBytes 方 法 检查 到 流 没 有 更 新 时 会 立 
只 消耗 很 小 的 CPU 资 


贯 源 。 


刻 归 还 执行 


ee 的 键盘 输 
被 分 配 运行 时 
令 牌 ， 这 种 等 








Finalizer 

Sienal Dispatcher 
Attach Listener 
testBusyThresd 
FEMI ICP Accept-0 


BNI Scheduler (0) 











RMI TCP Cormection(1)-192. 168. 


1 





线程 | 
rr 1 «ir . 
Reference Handler 状态 : RUNNABLE 


阻塞 总 数 : 0 等待 总 数 : 0 


堆栈 追踪 
java. io。 
java. i0. 


java, 10. 


4 | 


FileInputStream. readBytes (Native Method) 
FileInput Stream. read(FileInputStream. java: 199) 
BufferedInput Stream, readl (BufferedInput Streanm. java: 256) = 


Wm 





Hy 








图 4-7 main 线 程 


接着 监控 testBusyThread 线 程 ， 如 图 4-8 所 示 ，testBusyThread 线 程 一 
直 在 执行 空 循环 ， 从 堆栈 追踪 中 看 到 一 直 在 MonitoringTest.java 代 码 的 41 
行 停留 ，41 行 为 : while (true) 。 这 时 候 线 程 为 Runnable 状 态 ， 而 且 没 
有 归还 线程 执行 令 牌 的 动作 ， 会 在 空 循环 上 用 尽 全 部 执行 时 间 直 到 线程 
切换 ， 这 种 等 待 会 消耗 较 多 的 CPU 资源 。 





线程 

main 4: testBusyThread 

: RUNNABLE 

总 数 : 0 “等待 总 数 : 0 





Reference Handler | 
Finalizer | 
Sienal Dispatcher s| 

| 

| 

| 


Attach Listener 


追踪 : 


testBusylhread | 
RMI ICP Accept-0 J fenixsoft.monitoring. MonitoringTest $1. run (fp oe) 


RMI ICP Conmection (1)-192. 168 h. lang. Thread. run(Thread. java: 662) 
FMI Scheduler (0) i 


4 | 8 上 站 | 




















图 4-8 testBusyThread 线 程 


图 4-9 显 示 testLockThread 线 程 在 等 等 着 lock 对 象 的 notify 或 notifyAll 
方法 的 出 现 ， 线 程 这 时 候 处 于 WAITING 状 态 ， 在 被 唤醒 前 不 会 被 分 配 
执行 时 间 。 


线程 | 

ee Ee 名 称 : testLockThread 

testBusyIhread 找 态 : WAITING 在 java. lang.0bject@3c83ad0 上 
RMI ICP Acceept-0 阻塞 总 数 : 0 ”等待 总 数 : 1 

RMI TCP Cormection (1)-192. 168. 
RNMI Scheduler (0) 


MY server connection timeout | 三 R | 
RMI TCP Conneetion (2)-192 168. java. lang.Object. wait (Native Method) 


RMI TCP Connection(S)-192. 168. java. lang.Object. wait (Object. java: 485) 
tastLocklhread ™ |com. fenixsoft.monitoring. Monitorinelest$2. run(MonitorineTest. java: 
4 | WW | + «| WU | 





堆栈 追踪 : 














图 4-9 testLockThread 线 程 


testLockThread 线 程 正在 处 于 正常 的 活 锁 等 待 ， 只 要 lock 对 象 的 
notify() 或 notifyAll0 方 法 被 调用 ， 这 个 线程 便 能 激活 以 继续 执行 。 代 码 
清单 4-10 演 示 了 一 个 无 法 再 被 激活 的 死 锁 等 符 。 


代码 清单 4-10 “有 死 锁 代 码 样 例 





/* 

* 线 程 死 锁 等 待 演示 

*/ 

static class SynAddRunalbe implements Runnablel{ 
int a,b; 

public SynAddRunalbe (int a,int b) { 

this.a=a; 

this .b=b; 

} 
QOverride 

public void run(){ 

synchronized (Integer.valueOf (a) ) { 
synchronized (Integer.valueOf (b) ) { 
System.out .println (a+b) ; 

} 

} 

} 

} 

public static void main (String[]args) 1 

for (int i=0; i<100; i++) { 

new Thread (new SynAddRunalbe (1, 2) ) .start(); 
new Thread (new SynAddRunalbe (2, 1) ) .start(); 
} 

} 





















































这 段 代 码 开 了 200 个 线程 去 分 别 计算 1+2 以 及 2+1 的 值 ， 其 实 for 循 环 
古 可 省 略 的 ， 两 个 线程 也 可 能 会 叶 致 死 锁 ， 不 过 那样 概率 太 小 ， 需 要 汤 
试 运行 很 多 次 才能 看 到 效果 。 一 般 的 话 ， 币 for 循环 的 版 本 最 多 运行 2~3 


次 束 会 允 到 线程 死 锁 ， 程 序 无 法 结束 。 造 成 死 锁 的 原因 是 
Integer.valueOf() 方 法 基于 减少 对 象 创建 次 数 和 节省 内 存 的 考虑 ，[-128， 
127] 之 间 的 数字 会 被 缓存 831， 当 valueOfO 方 法 传 入 参数 在 这 个 范围 之 
内 ， 将 直接 返回 缓存 中 的 对 象 。 也 就 是 说 ， 代 人 码 中 调用 了 200 次 
Integer.valueOfO 方 法 一 共 就 只 返回 了 两 个 不 同 的 对 象 。 假 如 在 某 个 线程 
的 两 个 synchronized 块 之 间 发 生 了 一 次 线程 切换 ， 那 就 会 出 现 线程 A 等 着 
被 线程 B 持 有 的 Integer.valueOf (1) ， 线 程 B 又 等 着 被 线程 A 持 有 的 
Integer.valueOf (2) ， 结 果 出 现 大 家 都 跑 不 下 去 的 情景 。 








出 现 线程 死 锁 之 后 ， 点 击 JConsole 线 程 面板 的 “检测 到 死 锁 ” 按 钮 ， 
将 出 现 一 个 新 的 “ 死 锁 ”* 页 签 ， 如 图 4-10 所 示 。 


| 线程 | 死 鳞 

Thread-199 1 名 称 : Ihread-43 

状态 : BLOCKED 在 java. lang. Integer@Tcbdb375 上 ， 拥有 者 : Thread-12 
ee 阻塞 总 数 : 1 等待 总 数 : 0 


摊 乒 追踪 : 

com. fenixsoft,. monitoring. IhreaqdDeadLockIest$SynaAddRunalbe. run(Ihrl 
-~ 已 锁定 java. lang. Integer@76c3358b 

|java. lang, Thread. run(Thread. java: 662) 














图 4-10 线程 死 锁 


图 4-10 中 很 清晰 地 显示 了 线程 Thread-43 在 等 待 一 个 被 线程 Thread-12 
持 有 Integer 对 象 ， 而 点 击 线程 Thread-12 则 显示 它 也 在 等 待 一 个 Integer 对 
象 ， 被 线程 Thread-43 持 有 ， 这 样 两 个 线程 就 互相 卡 住 ， 都 不 存在 等 到 锁 
释放 的 希望 了 。 


[1]VisualVM 官 方 站 点 : https://visualvm.dev.java.net/。 

四 准确 地 说 ， 只 有 在 虚拟 机 使 用 解释 器 执行 的 时 候 ，“ 在 作用 域 之 
内 ”才能 保证 它 不 会 被 回收 ， 因 为 这 里 的 回收 还 涉及 局 部 变量 表 Slot 复 
用 、 即 时 编译 器 介入 时 机 等 问题 ， 具 体 读 者 可 参考 第 8 章 中 关于 局 部 变 
量 表 内 存 回收 的 例子 。 


D 软 认 值 ， 实 际 值 取 决 于 java.lang.Integet.IntegetCache.high 参 数 的 设置 。 


4.3.2 VisualVM: 多 合 一 故障 处 理工 具 


VisualVM (All-in-One Java Troubleshooting Tool) 是 到 目前 为 止 随 
JDK 发 布 的 功能 最 强大 的 运行 监视 和 故障 处 理 程序 ， 并 且 可 以 预见 在 未 
来 一 段 时 间 内 都 是 官方 主力 发 展 的 虚拟 机 故障 处 理工 具 。 官 方 在 
VisualVM 的 软件 说 明 中 写 上 了 "All-in-One" 的 描述 字样 ， 预 示 着 它 除了 
运行 监视 、 故 障 处 理 外 ， 还 提供 了 很 多 其 他 方面 的 功能 。 如 性 能 分 析 

CProfiling) ，VisualVM 的 性 能 分 析 功 能 甚至 比 起 JProfiler、YourKit 等 
专业 且 收 费 的 Profiling 工 具 都 不 会 逊色 多 少 ， 而 且 VisualVM 的 还 有 一 个 
很 大 的 优点 : 不 需要 被 监视 的 程序 基于 特殊 Agent 运 行 ， 因 此 它 对 应 用 
程序 的 实际 性 能 的 影响 很 小 ， 使 得 它 可 以 直接 应 用 在 生产 环境 中 。 这 个 
优点 是 JProfiler、YourKit 等 工具 无 法 与 之 媲美 的 。 














1.VisualVM 兼 容 范 围 与 插件 安装 


VisualVM 基 于 NetBeans 平 台 开 发 ， 因 此 它 一 开始 就 具备 了 插件 扩展 
功能 的 特性 ， 通 过 插件 扩展 支持 ，VisualVM 可 以 做 到 : 


显示 虚拟 机 进程 以 及 进程 的 配置 、 环 境 信息 (jps、jinfo)。 


监视 应 用 程序 的 CPU、GC、 堆 、 方 法 区 以 及 线程 的 信息 Gjstat、 


jstack) 。 


dump 以 及 分 析 堆 转 储 快照 Cjmap、jhat) 。 





方法 级 的 程序 运行 性 能 分 析 ， 找 出 被 调 用 最 多 、 运 行 时 间 最 长 的 方 
0 


离线 程序 快照 : 收集 程序 的 运行 时 配置 、 线 程 dump、 内 存 dump 等 
言 恩 建 立 一 个 快照 ， 可 以 将 快照 发 送 开发 者 处 进行 Bug 反 馈 。 


其 他 plugins 的 无 限 的 可 能 性 ..……. 








VisualVM 在 JDK 1.6 update 7 中 才 首 次 出 现 ， 但 并 不 意味 看 它 只 能 
监控 运行 于 JDK 1.6 上 的 程序 ， 它 具备 很 强 的 向 下 兼容 能 力 ， 甚 至 能 向 
下 兼容 至 近 10 年 前 发 布 的 JDK 1.4.2 平 台山 ， 这 对 无 数 已 经 处 于 实施 、 维 
护 的 项 目 很 有 意义 。 当 然 ， 并 非 所 有 功能 都 能 完美 地 向 下 兼容 ， 主 要 特 
性 的 兼容 性 见 表 4-6。 








表 4-6 VisualVM 主要 特性 的 兼容 性 列表 


特 性 JDK 1.4.2 JDK 1.5 JDK 1.6 local JDK 1.6 remote 
运 和 J 环境 信 息 ~ ~ ~ ~ 
系统 属性 T 


监视 面板 
线程 面板 
性 能 监控 
堆 、 线 程 Dump 




















MBean 管理 











JConsole 插件 





首次 启动 VisualVM 后 ， 读 者 先 不 必 着 急 找 应 用 程序 进行 监测 ， 


为 现在 VisualVM 还 没有 加 载 任何 插件， 虽然 基本 的 监视 、 线 程 面板 的 
功能 主 程序 都 以 默认 插件 的 形式 提供 了 ， 但 是 不 给 VisualVM 装 任何 扩 
展 插 件 ， 就 相当 于 放弃 了 它 最 精华 的 功能 ， 和 没有 安 闭 任何 应 用 软件 操 
作 系 统 差 不 多 。 


插件 可 以 进行 手工 安装 ， 在 相关 网 站 (上 下 载 *.nbm 包 后 ， 点 击 “ 工 
有 具 ”- “插件 ”-, “已 下 载 " 菜 单 ， 然 后 在 弹出 的 对 话 框 中 指定 nbbm 包 路 径 便 
可 进行 安装 ， 插 件 安装 后 存放 在 JDK_HOMEVlib/visualvmy/visualvm 中 。 
不 过 手工 安装 并 不 常用 ， 使 用 VisualVM 的 自动 安装 功能 已 经 可 以 找到 
大 多 数 所 需 的 插件 ， 在 有 网 络 连 接 的 环境 下 ， 点 击 “ 工 具 ”- “插件 菜 
单 ”， 弹 出 如 图 4-11 所 示 的 插件 页 签 ， 在 页 签 的 “可 用 插件 ”中 列举 了 当前 
版 本 VisualVM 可 以 使 用 的 插件 ， 选 中 插件 后 在 右边 窗口 将 显示 这 个 插 
件 的 基本 信息 ， 如 开发 者 、 版 本 、 功 能 描述 等 。 

















VisualWIE-Glassfish 
YisualW-Cliassfish Applicati on 


Java ME Profiler Snap... 

Visual WM-Extensions Platform 
VisualW-Ssmpler Profiling 
BIrscesVistalVWM Profiling 
VisualyW-Security Security 
VisualVW-JCornsole Tools 
VisualVM-MBeans Tools 
VisualYM-BufferMonitor Tools 
Visual CC Tools 
SAPlugin Tools 
VisualWi 05Gi Plugin Tools 
SysIray Tools 
KillApplication Tools 
VisualVWM-JymCapabilities Tools 


| 激活 人 | | 取消 激活 0@) | | 知 载 D | 


版 本 : 1.3 
源 : 而 sualWM 插件 中 心 


插件 描述 


A sample plugin giving an overview of 
advanced monitoring capabilities of 
VisualWM. Enhances monitorineg of 
GlassFish spplication server by adding 
specialized overview, new tab for 
monitoring HTIP Service and the ability 
to visually select and monitor any of 
the deployed web applications 


国 国 国 国 国 国 国 国 国 国 国 国 国 国 局 
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图 4-11 VisualVM 播 件 页 签 





大 家 可 以 根据 目 己 的 工作 需要 和 兴趣 选择 合适 的 插件 ， 然 后 点 击 安 
装 按钮 ， 弹 出 如 岁 4-12 所 示 的 下 载 进度 窗口 ， 跟 着 提示 操作 即 可 完成 安 
装 。 


下 载 
请 稍 候 ， 直 至 安装 程序 下 载 完 请 求 的 插件 。 


正在 下 载 插件 .. . 
| 
Visual VM-IDA-Library-Component 

在 后 台 运 行 ®®) 














Ew |( Rm | (i [0] 





图 4-12 VisualVM 插 件 安 装 过 程 


安装 完 插 件 ， 选 择 一 个 需要 监视 的 程序 就 进入 程序 的 主 界面 了 ， 如 
图 4-13 所 示 。 根 据 读 者 选择 安装 插件 数量 的 不 同 ， 看 到 的 页 签 可 能 和 图 
4-13 中 的 有 所 不 同 。 


文件 F) 应 用 程序 人 A) 视图 VY) 工具 G) 窗口 W) 都 助 00 

:七 辕 :名 的 恒 

:应 用 程序 

日 髓 | 本 地 
| 页 saalWl 


- 息 orE. eclipse. equi 
i ee © org. eclipse. equinox. launcher. Main (pid 10112) 


1 -和 窟 到 各 报 术 玩 保 存 的 数据 “ 辣 详 细 信息 | | 
俩 快照 | 














PID: 10112 

主机 : localhost 

主 类 : org eclipse. equinox. 1auncher. MMain 

参数 : -os win32 -ws win32 ~arch x86 -showsplash -launcher D:\ DevSpace\Eclipse 3.5\ecli 





JVN: Java HotSpot (IM) Client WW (17 0-b16，mixed mode, sharing) 
Javs Home 目录 : DD:\ DevSpace\jdkl.6.0 21\jre 

JW 标志 : 《无 

出 现 00ME 时 生成 堆 aamp: 禁用 


保存 的 数据 x | Jm 参数 | 系统 属性 | JW capabilities 





线程 Dump: 0 3 ~Dosgi. requiredJavaVersion=-!.5 
挫 Damp: 0 - -Inr5l2n 


em ~ -Ims512m 

















图 4-13 VisualVM 主 界面 


VisualVM 中 “概述 “监视 “线程 ” "MBeans" 的 功能 与 前 面 介 绍 
的 JConsole 差 别 不 大 ， 读 者 根据 上 文 内 容 类 比 使 用 即 可 ， 下 面 挑选 几 个 
特色 功能 、 插 件 进 行 介绍 。 


2. 生 成 、 浏 览 堆 转 储 快 照 


在 VisualVM 中 生成 dump 文 件 有 两 种 方式 ， 可 以 执行 下 列 任 一 操 
作 : 








在 “应 用 程序 ”窗口 中 右键 单 击 应 用 程序 节点 ， 然 后 选择 “ 堆 


Dump”。 








在 “应 用 程序 ”窗口 中 双击 应 用 程序 节点 以 打开 应 用 程序 标签 ， 然 后 
在 “监视 ”标签 中 单 击 “ 堆 Dump”。 





生成 了 dump 文 件 之 后 ， 应 用 程序 页 签 将 在 该 堆 的 应 用 程序 下 增加 
一 个 以 heapdump] 开 头 的 子 节 点 ， 并 且 在 主页 签 中 打开 了 该 转 储 快照 ， 
如 图 4-14 所 示 。 如 果 需 要 把 dump 文 件 保 存 或 发 送出 去 ， 要 在 heapdump 
节点 上 右键 选择 “另存 为 ” 沫 单 ， 否 则 当 VisualVM 关 闭 时 ， 生 成 的 dump 
文件 会 被 当做 临时 文件 删除 掉 。 要 打开 一 个 已 经 存在 的 dump 文 件 ， 通 
过 文件 菜单 中 的 “ 装 入 ”功能 ， 选 择 硬盘 上 的 dump 文 件 即 可 。 








[re eR rr—* EE 
文件 @) 启用 程序 W) 视 因 W) 工具 0) 雷 D 帮助 0 
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图 4-14 浏览 dump 文 件 


从 堆 页 签 中 的 “摘要 ”面板 可 以 看 到 应 用 程序 dump 时 的 运行 时 参数 、 

System.getProperties() 的 内 容 、 线 程 堆 栈 等 信息 ,，“ 类 ”面板 则 是 以 类 为 统 
计 口 径 统计 类 的 实例 数量 、 容 量 信息 , “实例 ?面板 不 能 直接 使 用 ， 因 为 
不 能 确定 用 户 想 查看 哪个 类 的 实例 ， 所 以 需要 通过 “类 ?面板 进入 ， 
在 “类 ”中 选择 一 个 关心 的 类 后 双击 鼠标 ， 即 可 在 “实例 ”里 面 看 见 此 类 中 
500 个 实例 的 具体 属性 信息 。“OQL 控 制 台 ” 面 板 中 就 是 运行 OQL 查 询 语 
句 的 ， 同 jhat 中 介绍 的 OQL 功 能 一 样 。 如 果 需 要 了 解 具体 OQL 语 法 和 使 
用 ， 可 参见 本 书 附录 DD 的 内 容 。 








3. 分 析 程 序 性 能 





在 Profiler 页 签 中 ，VisualVM 提 供 了 程序 运行 期 间 方 法 级 的 CPU 执 
行 时 间 分 析 以 及 内 存 分 析 ， 做 Profiling 分 析 肯 定 会 对 程序 运行 性 能 有 比 
较 大 的 影响 ， 所 以 一 般 不 在 生产 环境 中 使 用 这 项 功能 。 








要 开始 分 析 ， 先 选择 "CPU" 和 和 “内存” 按钮 中 的 一 个 ， 然 后 切换 到 应 
用 程序 中 对 程序 进行 操作 ，VisualVM 会 记录 到 这 段 时 间 中 应 用 程序 执 
行 过 的 方法 。 如 果 是 CPU 分 析 ， 将 会 统计 每 个 方法 的 执行 次 数 、 执 行 耗 
时 ; 如 果 是 内 存 分 析 ， 则 会 统计 每 个 方法 关联 的 对 象 数 以 及 这 些 对 象 所 
占 的 空间 。 分 析 结 束 后 ， 点 击 “ 停 止 ?按钮 结束 监控 过 程 ， 如 图 4-15 所 


人 钞 。 
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图 4-15 对 应 用 程序 进行 CPU 执行 时 间 分 析 


注意 ”在 JDK 1.5 之 后 ， 在 Client 模 式 下 的 虚拟 机 加 入 并 且 自 动 开启 
了 类 共享 一 这 是 一 个 在 多 虚拟 机 进程 中 共享 rtjar 中 类 数据 以 提高 加 载 
速度 和 节省 内 存 的 优化 ， 而 根据 相关 Bug 报 告 的 反映 ，VisualVM 的 
Profiler 功 能 可 能 会 因为 类 共享 而 导致 被 监视 的 应 用 程序 月 溃 ， 所 以 读者 
进行 Profiling 前 ， 最 好 在 被 监视 程序 中 使 用 -Xshare:off 参 数 来 关闭 类 共享 
优化 。 


图 4-15 中 是 对 Eclipse IDE 一 段 操作 的 录制 和 分 析 结果 ， 该 者 分 析 目 
己 的 应 用 程序 时 ， 可 以 根据 实际 业务 的 复杂 程度 与 方法 的 时 间 、 调 用 次 





数 做 比较 ， 找 到 最 有 优化 价值 的 方法 。 





4.BTrace 动 态 日 志 跟 踪 


BTracel3 引 是 一 个 很 有趣” 的 VisualVM 插 件 ， 本 身 也 是 可 以 独立 运行 
的 程序 。 它 的 作用 是 在 不 停止 目标 程序 运行 的 前 提 下 ， 通 过 HotSpot 虚 
拟 机 的 HotSwap 技 术 呈 动态 加 入 原本 并 不 存在 的 调试 代码 。 这 项 功能 对 
实际 生产 中 的 程序 很 有 意义 : 经 常 遇 到 程序 出 现 问题 ， 但 排查 错误 的 一 
些 必要 信息 ， 辟 如 方法 参数 、 返 回 值 等 ， 在 开发 时 并 没有 打印 到 日 志 之 
中 ， 以 至 于 不 得 不 停 掉 服务 ， 通 过 调试 增 量 来 加 入 日 志 代 码 以 解决 问 
题 。 当 遇 到 生产 环境 服务 无 法 随便 停止 时 ， 缺 一 两 句 日 志 导 儿 排 错 进行 
不 下 去 是 一 件 非 常 郁闷 的 事情 。 











在 VisualVM 中 安装 了 BTrace 插 件 后 ， 在 应 用 程序 面板 中 右键 点 击 要 
调试 的 程序 ， 会 出 现 "Trace Application......" 菜 单 ， 点 击 将 进入 BTrace 面 
板 。 这 个 面板 里 面 看 起 来 就 像 一 个 简单 的 Java 程 序 开发 环境 ， 里 面 还 有 
一 小 段 Java 人 代码， 如 图 4-16 所 示 。 








时 [| VisualW™ | 
[heapdunp] 10] 
1 Se EQUID 








BIrsce 


Irace 


} 





public class TracingSeript { 
/Jw put your code here | 


O org. eclipse. equinox. launcher. Main (pid 3312) 


请 0pen .. 园 seve hs 节 stert 画 :t。> § Evant 


1 /* Blrace Script ITemplate */ 
inport con. sun,btrace. arnotations.*; 
inport static com. sun. btrace.BIraceUtils.*; 


i yen 6 Balrace x | 


四 oatpat Cass-Path 











图 4-16 BTrace 动 态 跟 踪 


笔者 准备 了 一 段 很 简单 的 Java 代 码 来 演示 BTrace 的 功能 : 产生 两 个 
1000 以 内 的 随机 整数 ， 输 出 这 两 个 数字 相 加 的 结果 ， 如 代码 清单 4-11 所 


钞 。 


代码 清单 4-11 BTrace 跟 踪 演 示 





public c 


lass BTraceTestt{ 








public int aqd (int a,int b) { 


return a+b; 


} 


public s 











BufferedI 





BIraceTest test=new BITraceTes 
Reader reader=new Buf 





tatic void main (String[]args) throws 


ts 











feredReader (new 








IOExceptiont{ 





InputStreamReader (System.in) ) ; 

for (int i=0; i<10; i++) { 

reader.readLine ():; 

int a= (int) Math.round (Math.random()*1000).; 
int b= (int) Math.round (Math.random()*1000).; 
System.out .println (test.add (a,b) ) ; 

} 

} 

} 



































程序 运行 后 ， 在 VisualVM 中 打开 该 程序 的 监视 ， 在 BTrace 页 签 填 充 
TracingScript 的 内 容 ， 输 入 的 调试 代码 如 代码 清单 4-12 所 示 。 


代码 清单 4-12 ”BTrace 调 试 代码 








/*BTrace Script Template*/ 
ijmport com.sun.btrace.annotations.*; 
ijmport static com.sun.btrace.BTraceUtils.*; 
@QBTrace 
public class TracingScriptt{ 
QOnMethod ( 
clazz="org.fenixsoft.monitoring.BTraceTest", 
method="add", 
location=@Location (Kind.RETURN) 
) 
public static void func (@Self org.fenixsoft.monitoring.BTraceTest 
instance,int a,int b, @Return int result) 1 
println ("调用 堆栈 :") ; 
J 名 让 (3 
println (strcat ("方法 参数 A:",，str (a) ) ) ; 
println (strcat ("方法 参数 B:"，str (b) ) ) ; 
println (strcat ("方法 结果 :",，str (result) ) ); 
} 
} 














































































































点 击 "Start" 按 钮 后 稍 等 片刻 ， 编 译 完成 后 ， 可 见 Output 面 板 中 出 
现 "BTrace code successfuly deployed" 的 字样 。 程 序 运行 的 时 候 在 Output 


面板 将 会 输出 如 图 4-17 所 示 的 调试 信息 。 











起 org. fenixsoft. monitoring, BIrecelest (pid 4852) 
中 概述 4 蚊 视 导线 程 后 ] 


ia Visuslyh 
- 名 org. fenixsoft. monitorj A 
org eclipse equinox il ~ org. fenixzsoft. monitoring.BTraceTest (pid 4852) 
应 erg. eclipse. equinox.1¢| Blrace 加 output 


过 二 es 力 save Bs . | 即 Start 回 Stop | 多 Event 








public static void func(@Self org.fenixsoft,monitoring.BIraceTest instanc 
pzintln( 调用 堆栈 : ) 
jstack():; 
println(strcat ( ”方法 合力 A: ,str(a))) | 
println(strcat (" 方法 谷 数 B:“,str(b))); 
println(strcat ( 放 滨 结业;"，, str(result))); 
加 























org. fenixsoft.monitorinEg Blracelest nain (BIracelest. java:20) 
i ~ 一 














图 4-17 BTrace 跟 踪 结 果 


BTrace 的 用 法 还 有 许多 ， 打 印 调用 堆栈 、 参 数 、 返 回 值 只 是 最 基本 
的 应 用 ， 在 它 的 网 站 上 有 使 用 BTrace 进 行 性 能 监视 、 定 位 连接 沪 漏 和 内 
存 泄漏 、 解 决 多 线程 竞争 问题 等 例子 ， 有 兴趣 的 读者 可 以 去 相关 网 站 了 
解 一 下 。 


[1 时 于 JDK1.6 的 平台 ， 需 要 打开 -Dcom.sun.management.jmxremote 参 数 才 


能 被 VisualVM 管 理 。 

插件 中 心地 址 : http://Visualvm java.net/pluginscentetrs.html。 

[3] 官 方 主页 : http://kenai.com/projects/btrace/。 

[人 HotSwap 技 术 : 代码 热 蔡 换 技 术 ，HotSpot 虚 拟 机 允许 在 不 停止 运行 的 
情况 下 ， 更 新 已 经 加 载 的 类 的 代码 。 


4.4 ”本 童 小结 





本 章 介 绍 了 随 JDK 发 布 的 6 个 命令 行 工 具 及 两 个 可 视 化 的 故障 处 理 
工具 ， 灵 活 使 用 这 些 工 具 可 以 给 问题 处 理 带 来 很 大 的 便利 。 





除了 JDK 目 带 的 工具 之 外 ， 常 用 的 故障 处 理工 具 还 有 很 多 ， 如 果 读 
者 使 用 的 是 非 Sun 系 列 的 JDK、 非 HotSpot 的 虚拟 机 ， 就 需要 使 用 对 应 的 
工具 进行 分 析 ， 如 : 


IBM 的 Support AssistantL、Heap Analyzer! ”|、Javacore Analyzerl |、 
Garbage Collector Analyzerl 和 适用 于 IBM J9 VM.。 


HP 的 HPjmeterl5lj、HPjtune 适 用 于 HP-UX、SAP、HotSpot VM.。 


Eclipse 的 Memory Analyzer Tooll 中 (MAT) 适用 于 HP-UX、SAP、 
HotSpot VM， 安 装 IBM DTFJ 插 件 后 可 支持 IBM J9 VM。 


BEA 的 JRockit Mission Controll | 适用 于 JRockit VM。 


[llhttp:/ /www.alphawotks.ibm.com/tech/heapanalyzer/download。 
[2]http:/ /www.alphawotks.ibm.com/tech/jca/ download。 
[3]http:/ /www.alphawotks.ibm.com/tech/pmat/ download。 


[4]https://h20392.www2.hp.com/portal/swdepot/ displayProductInfo.do? 


btoductNumbet=HPJMETER 。 
[5]http:/ /www.eclipse.oteg/mat/ 。 
[6lhttp:/ /www.ibm.com/ developerworks/java/jdk/tools/dtfj.html。 


[http:/ /download.oracle.com/docs/cd/E13150_01/jrockit_jvm/jrockit/tools, 


第 5 章 ” 调 优 和 案例 分 析 与 实战 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 “高 
墙 "， 墙 外 面 的 人 想 进 去 ， 增 里 面 的 人 却 想 出 来 。 


5.1 概述 





上 文 介绍 了 处 理 Java 虚 拟 机 内 存 问题 的 知识 与 工具 ， 在 处 理 实际 项 
目的 问题 时 ， 除 了 知识 与 工具 外 ， 经 验 同 样 是 一 个 很 重要 的 因素 。 因 此 
本 章 将 与 读者 分 享 几 个 比较 有 代表 性 的 实际 案例 。 考 虑 到 虚拟 机 故障 处 
理 和 调 优 主要 面 癌 各 类 服务 端 应 用 ， 而 大 部 分 Java 程 序 员 较 少 有 机 会 直 
接 接 触 生产 环境 的 服务 器 ， 因 此 本 章 还 准备 了 一 个 所 有 开发 人 员 都 能 够 
进行 < 杀 里 实战 ”的 练习 ， 希 望 通过 实践 使 读者 获得 故障 处 理 和 调 优 的 经 











验 。 


5.2 ”案例 分 析 


本 章 中 的 案例 大 部 分 来 源 于 笔者 处 理 过 的 一 些 问题 ， 还 有 一 小 部 分 
来 源 于 网 络 上 比较 有 特色 和 代表 性 的 案例 总 结 。 出 于 对 客户 商业 信息 保 
护 的 目的 ， 在 不 影响 前 后 逻辑 的 前 提 下 ， 笔 者 对 实际 环境 和 用 户 业 务 做 
了 一些 屏蔽 和 精简 。 


5.2.1 ”高 性 能 硬件 上 的 程序 部 署 策略 








例如 ， 一 个 15 万 PV/ 天 左右 的 在 线 文档 类 型 网 站 最 近 更 换 了 硬件 系 
统 ， 新 的 硬件 为 4 个 CPU、16GB 物 理 内 存 ， 操 作 系统 为 64 位 CentOS 
5.4，Resin 作 为 Web 服 务 器 。 整 个 服务 器 暂时 没有 部 署 别 的 应 用 ， 所 有 
硬件 资源 都 可 以 提供 给 这 访问 量 并 不 算 太 大 的 网 站 使 用 。 管 理 员 为 了 尽 
量 利 用 硬件 资源 选用 了 64 位 的 JDK 1.5， 并 通过 -Xmx 和 -Xms 参 数 将 Java 
堆 固 定 在 122GB。 使 用 一 段 时 间 后 发 现 使 用 效果 并 不 理想 ， 网 站 经 常 不 
定期 出 现 长 时 间 失 去 响应 的 情况 。 








监控 服务 器 运行 状况 后 发 现 网 站 失去 响应 是 由 GC 停顿 导致 的 ， 虚 
拟 机 运行 在 Server 模 式 ， 默 认 使 用 吞吐 量 优先 收集 器 ， 回 收 12GB 的 堆 ， 
一 次 Full GC 的 停顿 时 间 高 达 14 秒 。 并 且 由 于 程序 设计 的 关系 ， 访 问 文 
档 时 要 把 文档 从 磁盘 提取 到 内 存 中 ， 导 致 内存 中 出 现 很 多 由 文档 序列 化 


产生 的 大 对 象 ， 这 些 大 对 象 很 多 都 进入 了 老年 代 ， 没 有 在 Minor GC 中 清 
理 掉 。 这 种 情况 下 即使 有 12GB 的 堆 ， 内 存 也 很 快 被 消耗 列 尽 ， 由 此 时 
至 每 隔 十 几 分 钟 出 现 十 几 秒 的 停顿 ， 令 网 站 开发 人 员 和 管理 员 感 到 很 肖 
交 。 





这 里 先 不 延伸 讨论 程序 代码 问题 ， 程 序 部 晋 上 的 主要 问题 显然 是 过 
大 的 堆 内 存 进行 回收 时 带 来 的 长 时 间 的 停顿 。 硬 件 升级 前 使 用 32 位 系统 
1.5GB 的 堆 ， 用 户 只 感觉 到 使 用 网 站 比较 缓慢 ， 但 不 会 发 生 十 分 明显 的 
停顿 ， 因 此 才 考 虑 升级 硬件 以 提升 程序 效能 ， 如 果 重 新 缩小 给 Java 堆 分 
配 的 内 存 ， 那 么 硬件 上 的 投资 就 显得 很 浪费 。 











在 高 性 能 硬件 上 部 署 程序 ， 目 前 主要 有 两 种 方式 : 


通过 64 位 JDK 来 使 用 大 内 存 。 


使 用 若干 个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 





此 案例 中 的 管理 员 采 用 了 第 一 种 部 署 方式 。 对 于 用 户 交 互 性 强 、 对 
停顿 时 间 敏 感 的 系统 ， 可 以 给 Java 虚 拟 机 分 配 超大 堆 的 前 提 是 有 把 握 把 
应 用 程序 的 Full GC 频率 控制 得 足够 低 ， 至 少 要 低 到 不 会 影响 用 户 使 
用 ， 壁 如 十 几 个 小 时 乃至 一 天 才 出 现 一 次 Full GC， 这 样 可 以 通过 在 深 
夜 执行 定时 任务 的 方式 触发 Full GC 甚至 自动 重启 应 用 服务 器 来 保持 内 
存 可 用 空间 在 一 个 稳定 的 水 平 。 














控制 Full GC 频 率 的 关键 是 看 应 用 中 绝 大 多 数 对 象 能 否 符合 “明生 夕 
灭 ” 的 原则 ， 即 大 多 数 对 象 的 生存 时 间 不 应 太 长 ， 尤 其 是 不 能 有 成 批量 
的 、 长 生存 时 间 的 大 对 象 产生 ， 这 样 才 能 保障 老年 代 空间 的 稳定 。 





在 大 多 数 网 站 形式 的 应 用 里 ， 主 要 对 象 的 生存 周期 都 应 该 是 请 求 级 
或 者 页 面 级 的 ， 会 话 级 和 全 局 级 的 长 生命 对 象 相 对 很 少 。 只 要 代码 写 得 
合理 ， 应 当 都 能 实现 在 超大 堆 中 正常 使 用 而 没有 Full GC， 这 样 的 话 ， 
使 用 超大 堆 内 存 时 ， 网 站 啊 应 速度 才 会 比较 有 保证 。 除 此 之 外 ， 如 果 读 
者 计划 使 用 64 位 JDK 来 管理 大 内 存 ， 还 需要 考虑 下 面 可 能 面临 的 问题 : 





内 存 回 收 导 致 的 长 时 间 停 顿 。 


现 阶 段 ，64 位 JDK 的 性 能 测试 结果 普遍 低 于 32 位 JDK。 





需要 保证 程序 足够 稳定 ， 因 为 这 种 应 用 要 是 产生 堆 溢 出 几乎 就 无 法 
产生 堆 转 储 快照 (因为 要 产生 十 几 GB 乃 至 更 大 的 Dump 文 件 ) ， 哪 怕 产 
生 了 快照 也 几乎 无 法 进行 分 析 。 

相同 程序 在 64 位 JDK 消 耗 的 内 存 一 般 比 32 位 JDK 大 ， 这 是 由 于 指针 
膨胀 ， 以 及 数据 类 型 对 齐 补 白 等 因素 导致 的 。 


上 面 的 问题 听 起 来 有 点 吓人 ， 上 所 以 现 阶段 不 少 管理 员 还 是 选择 第 二 
种 方式 : 使 用 若干 个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 具 体 做 
法 是 在 一 合 物理 机 器 上 局 动 多 个 应 用 服务 器 进程 ， 每 个 服务 器 进程 分 配 


不 同 端口 ， 然 后 在 前 端 搭建 一 个 负载 均衡 促 ， 以 反问 代理 的 方式 来 分 配 
访问 请 求 。 读 者 不 需要 太 过 在 意 均 衡器 转发 所 消耗 的 性 能 ， 即 使 使 用 64 
位 JDK， 许 多 应 用 也 不 止 有 一 台 服 务 器 ， 因 此 在 许多 应 用 中 前 并 的 均衡 
融 总 是 要 存在 的 。 


考虑 到 在 一 台 物 理 机 器 上 建立 逻辑 集群 的 目的 仅仅 是 为 了 尽 可 能 利 
用 硬件 资源 ， 并 不 需要 关心 状态 保留 、 热 转移 之 类 的 高 可 用 性 需求 ， 也 
不 需要 保证 每 个 虚拟 机 进程 有 绝对 准确 的 均衡 负载 ， 因 此 使 用 无 Session 
复制 的 杀 合 式 集群 是 一 个 相当 不 错 的 选择 。 我 们 仅仅 需要 保障 集群 具备 
杀 合 性 ， 也 就 是 均衡 器 按 一 定 的 规则 算法 《一 般 根据 SessionID 分 配 ) 将 
一 个 固定 的 用 户 请 求 永远 分 配 到 固定 的 一 个 集群 节点 进行 处 理 即 可 ， 这 
样 程序 开发 阶段 束 基 本 不 用 为 集群 环境 做 什么 特别 的 考虑 了 。 








当然 ， 很 少 有 没有 缺点 的 方案 ， 如 果 读 者 计划 使 用 逻辑 集群 的 方式 
来 部 普 程 序 ， 可 能 会 遇 到 下 面 一 些 问 题 : 


尽量 避免 节点 竞争 全 局 的 资源 ， 最 典型 的 就 是 磁盘 竞争 ， 各 个 节点 
如 果 同 时 访问 某 个 磁盘 文件 的 话 〈 尤 其 是 并 发 写 操作 容易 出 现 问题 ) ， 
很 容易 导致 IO 异 常 。 


很 难 最 高 效率 地 利用 某 些 资 源 池 ， 辟 如 连接 池 ， 一 般 部 是 在 各 个 节 
点 建立 目 己 独立 的 连接 地 ， 这 样 有 可 能 导致 一 些 节 点 池 满 了 而 另外 一 些 
节点 仍 有 较 多 空余 。 尽 管 可 以 使 用 集中 式 的 JNDI， 但 这 个 有 一 定 复杂 性 





并 且 可 能 带 来 额外 的 性 能 开销 。 


各 个 节点 仍然 不 可 避免 地 受到 32 位 的 内 存 限 制 ， 在 32 位 Windows 平 
台中 每 个 进程 只 能 使 用 2GB 的 内 存 ， 考 虑 到 堆 以 外 的 内 存 开销 ， 堆 一 般 
最 多 只 能 开 到 1.5GB。 在 某 些 Linux 或 UNIX 系 统 〈 如 Solaris) 中， 可 以 
提升 到 3GB 乃 至 接近 4GB 的 内 存 ， 但 32 位 中 仍然 受 最 高 4GB 〈232) 内 存 
的 限制 。 


大 量 使 用 本 地 缓存 《如 大 量 使 用 HashMap 作 为 K/V 绥 存 ) 的 应 用 ， 
在 远 辑 集群 中 会 造成 较 大 的 内 存 浪费 ， 因 为 每 个 逻辑 节点 上 都 有 一 份 绥 
存 ， 这 时 候 可 以 考虑 把 本 地 缓存 改 为 集中 式 缓存 。 


介绍 完 这 两 种 部 署 方式 ， 再 重新 回 到 这 个 案例 之 中 ， 最 后 的 部 署 方 
案 调 整 为 建 并 5 个 32 位 JDK 的 逻辑 集群 ， 每 个 进程 按 2GB 内 存 计算 (其 
中 堆 固 定 为 1.5GB) ， 占 用 了 10GB 内 存 。 另 外 建立 一 个 Apache 服 务 作 为 
前 端 均衡 代理 访问 门户 。 考 虑 到 用 户 对 啊 应 速度 比较 关心 ， 并 且 文 档 服 
务 的 主要 压力 集中 在 磁盘 和 内 存 访问 ，CPU 资 源 敏感 度 较 低 ， 因 此 改 为 
CMS 收 集 器 进行 垃圾 回收 。 部 署 方式 调整 后 ， 服 务 再 没有 出 现 长 时 间 停 
顿 ， 速 度 比 硬件 升级 前 有 较 大 提升 。 





5.2.2 集群 间 同 步 导致 的 内 存 淤 出 


例如 ， 有 一 个 基于 B/S 的 MIS 系 统 ， 硬 件 为 两 台 2 个 CPU、8GB 内 存 
的 HP 小 型 机 ， 服 务 器 是 WebLogic 9.2， 每 台 机 器 启动 了 3 个 WebLogic 实 
例 ， 构 成 一 个 6 个 节点 的 亲 合 式 集群 。 由 于 是 亲 合 式 集群 ， 节 点 之 间 没 
有 进行 Session 同 步 ， 但 是 有 一 些 需求 要 实现 部 分 数据 在 各 个 节点 间 共 

。 开 始 这 些 数据 存放 在 数据 库 中 ， 但 由 于 读 写 频繁 竞争 很 激烈 ， 性 能 
影响 较 大 ， 后 面 使 用 JBossCache 构 建 了 一 个 全 局 缓存 。 全 局 缓存 启用 
后 ， 服 务 正常 使 用 了 一 段 较 长 的 时 间 ， 但 最 近 却 不 定期 地 出 现 了 多 次 的 
内 存 溢出 问题 。 








在 内 存 洲 出 异常 不 出 现 的 时 候 ， 服 务 内 存 回收 状况 一 直 正 常 ， 每 次 
内 存 回收 后 都 能 恢复 到 一 个 稳定 的 可 用 空间 ， 开 始 怀疑 是 程序 某 些 不 常 
用 的 代码 路 径 中 存在 内 存 泄漏 ， 但 管理 员 反 映 最 近 程 序 并 未 更 新 、 升 级 
过 ， 也 没有 进行 什么 特别 操作 。 只 好 让 服务 带 着 - 
XX:+HeapDumpOnOutOfMemoryError 参 数 运行 了 一 段 时 间 。 在 最 近 一 
次 溢出 之 后 ， 管 理 员 发 回 了 heapdump 文 件 ， 发 现 里 面 存在 着 大 量 的 
org.jgroups.protocols.pbcast.NAKACK 对 象 。 

















JBossCache 是 基于 自家 的 JGroups 进 行 集群 间 的 数据 通信 ，JGroups 
使 用 协议 栈 的 方式 来 实现 收发 数据 包 的 各 种 所 需 特性 自由 组 合 ， 数 据 包 


接收 和 发 送 时 要 经 过 每 层 协 议 栈 的 up0 和 down(0) 方 法 ， 其 中 的 NAKACK 
栈 用 于 保障 各 个 包 的 有 效 顺序 及 重 发 。JBossCache 协 议 栈 如 图 5-1 所 示 。 


本 oP Daemon Thread [DownHandler (VIEW_SYHC)] {Suspended (breakpoint at line 401 in NAKACK)) 
NAFACK, down {Event) line, 401 

NAKACK (Protocol). receivelownEvent (Event) line: S17 
UNICAST (Frotocol). passDownlEvent) line: 551 
UHICAST. down (Event) line: 355 

UNICAST (Frotocol). receiveDownEvent (Event) line: S17 
STABLE (Frotocol). passlown (Event) line: S51 

STABLE, down (Event) line: 283 

STABLE (Frotocol). receiveDownEvent (Event) line: S17 
FRAG (Protocol). passDown (Event) line: 551 

FRAG. down (Event) line: 139 

FRAG (Frotocol). receivelownEvent (Event) line: S17 
VIFEW_SYNC (Frotocol). passlowr (Event) line: 551 
VIEW_SYNC. down (Event) line: 166 

DownHandler. runl) line: 121 








中 


图 5-1 JBossCache 协 议 栈 


由 于 信息 有 传输 失败 需要 重 发 的 可 能 性 ， 在 确认 所 有 注册 在 
GMS (Group Membership Service) 的 节点 都 收 到 正确 的 信息 前 ， 发 送 
的 信息 必须 在 内 存 中 保留 。 而 此 MIS 的 服务 端 中 有 一 个 负责 安全 校 验 的 
全 局 Filter， 每 当 接收 到 请 求 时 ， 均 会 更 新 一 次 最 后 操作 时 间 ， 并 且 将 这 
个 时 间 同 步 到 所 有 的 节点 去 ， 使 得 一 个 用 户 在 一 段 时 间 内 不 能 在 多 台 机 
器 上 登录 。 在 服务 使 用 过 程 中 ， 往 往 一 个 页 面 会 产生 数 次 乃至 数 十 次 的 
请 求 ， 因 此 这 个 过 小 器 导致 集群 各 个 节点 之 间 网 络 交 互 非常 频 粽 。 当 网 
络 情况 不 能 满足 传输 要 求 时 ， 重 发 数据 在 内 存 中 不 断 堆 积 ， 很 快 就 产生 
了 内 存 洲 出 。 





这 个 案例 中 的 问题 ， 既 有 JBossCache 的 缺陷 ， 也 有 MIS 系 统 实现 方 
式 上 缺陷 。JBossCache 官 方 的 maillist 中 讨论 过 很 多 次 类 似 的 内 存 溢出 异 
常 问 题 ， 据 说 后 续 版 本 也 有 了 改进 。 而 更 重要 的 缺陷 是 这 一 类 被 集群 共 
享 的 数据 要 使 用 类 似 JBossCache 这 种 集群 缓存 来 同步 的 话 ， 可 以 允许 读 
操作 频繁 ， 因 为 数据 在 本 地 内 存 有 一 份 副本 ， 读 取 的 动作 不 会 耗费 多 少 
资源 ， 但 不 应 当 有 过 于 频 索 的 写 操 作 ， 那 样 会 市 来 很 大 的 网 络 同步 的 开 
销 。 





5.2.3 ” 堆 外 内 存 导致 的 洲 出 错误 


例如 ， 一 个 学 校 的 小 型 项 目 : 基于 B/S 的 电子 考试 系统 ， 为 了 实现 
客户 端 能 实时 地 从 服务 器 端 接收 考试 数据 ， 系 统 使 用 了 逆向 AJAX 技 术 
(也 称 为 Comet 或 者 Server Side Push) ， 选 用 CometD 1.1.1 作 为 服务 端 推 
送 框架 ， 服 务 器 是 Jetty 7.1.4， 人 硬件 为 一 台 普 通 PC 机 ，Core i5 CPU， 


4GB 内 存 ， 运 行 32 位 Windows 操 作 系 统 。 


测试 期 间 发 现 服务 端 不 定时 抛 出 内 存 溢出 异常 ， 服 务 器 不 一 定 每 次 
都 会 出 现 异 常 ， 但 假如 正式 考试 时 骨 溃 一 次 ， 那 估计 整 场 电子 考试 都 会 
乱 套 ， 网 站 管理 员 演 试 过 把 堆 开 到 最 大 ， 而 32 位 系统 最 多 到 1.6GB 惑 基 
本 无 法 再 加 大 了 ， 而 且 开 大 了 基本 没 效 果 ， 抛 出 内 存 溢出 异常 好 像 还 更 
加 频繁 了 。 加 入 -XX:+HeapDumpOnOutOfMemoryError， 居 然 也 没有 任 
何 反 应 ， 抛 出 内 存 溢出 异常 时 什么 文件 都 没有 产生 。 无 奈 之 下 只 好 挂 着 
jstat 并 一 直 紧 盯 屏 幕 ， 发 现 GC 并 不 频繁 ，Eden 区 、Survivor 区 、 老 年 代 
以 及 永久 代 内 存 全 部 都 表示 “情绪 稳定 ， 压 力 不 大 ”， 但 就 是 照样 不 停 地 
抛 出 内 存 溢 出 异常 ， 管 理 员 压 力 很 大 。 最 后 ， 在 内 存 溢出 后 从 系统 日 志 
中 找到 异常 堆栈 ， 如 代码 清单 5-1 所 示 。 


























代码 清单 5-1 异常 堆栈 





[org.eclipse.jetty.util.loglhandle failed 
java.lang.OutOfMemoryError:null] 














t sun.misc.Unsafe.allocateMemory (Native Method) 

t java.nio.DirectByteBuffer.<init> (DirectByteBuffer.java:99) 
t java.nio.ByteBuffer.allocateDirect (ByteBuffer.java:288) 

t org.eclipse.jetty.io.nio.DirectNIOBuffer.<init> 





































































































如 果 认 真 阅读 过 本 书 的 第 2 章 ， 看 到 有 异常 堆栈 就 应 该 清楚 这 个 抛 出 
内 存 溢出 异常 是 怎么 回 事 了 。 大 家 知道 操作 系统 对 每 个 进程 能 管理 的 内 
存 是 有 限制 的 ， 这 人 台 服 务 器 使 用 的 32 位 Windows 平 台 的 限制 是 2GB， 其 
中 划 了 1.6GB 给 Java 堆 ， 而 Direct Memory 内 存 并 不 算 入 1.6GB 的 堆 之 
内 ， 因 此 它 最 大 也 只 能 在 剩余 的 0.4GB 空 间 中 分 出 一 部 分 。 在 此 应 用 中 
导致 溢出 的 关键 是 ， 垃圾 收集 进行 时 ， 虚 拟 机 虽然 会 对 Direct Memory 进 
行 回 收 ， 但 是 Direct Memory 却 不 能 像 新 生 代 、 老 年 代 那 样 ， 发 现 空间 不 
足 了 就 通知 收集 器 进行 垃圾 回收 ， 它 只 能 等 待 老 年 代 满 了 后 Full GC， 
然后 “顺便 地 ” 帮 它 清理 掉 内 存 的 废弃 对 象 。 否 则 它 只 能 一 直 等 到 抛 出 内 
存 溢 出 异常 时 ， 先 catch 掉 ， 再 在 catch 块 里 面 “大 喊 " 一 
声 : "System.gc0!"。 要 是 虚拟 机 还 是 不 听 《〈 璧 如 打开 了 - 
XX:+DisableExplicitGC 开 关 ) ， 那 就 只 能 眼睁睁 地 看 着 堆 中 还 有 许多 空 
闲 内 存 ， 自 己 却 不 得 不 抛 出 内 存 溢出 异常 了 。 而 本 案例 中 使 用 的 
CometD 1.1.1 框 架 ， 正 好 有 大 量 的 NIO 操 作 需 要 使 用 到 Direct Memory 内 
存 。 














从 实践 经 验 的 角度 出 发 ， 除 了 Java 堆 和 永久 代 之 外 ， 我 们 注意 到 下 
面 这 些 区 域 还 会 占用 较 多 的 内 存 ， 这 里 所 有 的 内 存 总 和 受到 操作 系统 进 
程 最 大 内 存 的 限制 。 








Direct Memory: 可 通过 -XX:MaxDirectMemorySize 调 整 大 小 ， 内 存 
不 足 时 抛 出 OutOfMemoryError 或 者 OutOfMemoryError:Direct buffer 


memory。 


线程 堆栈 : 可 通过 -Xss 调 整 大 小 ， 内 存 不 足 时 抛 出 
StackOverflowError〈 纵 向 无 法 分 配 ， 即 无 法 分 配 新 的 栈 帧 ) 或 者 
OutOfMemoryError:unable to create new native thread (横向 无 法 分 配 ， 即 
无 法 建立 新 的 线程 ) 。 


Socket 绥 存 区 : 每 个 Socket 连 接 都 Receive 和 Send 两 个 缓存 区 ， 分 别 
占 大 约 37KB 和 25KB 内 存 ， 连 接 多 的 话 这 块 内 存 占用 也 比较 可 观 。 如 果 
无 法 分 配 ， 则 可 能 会 抛 出 IOException:Too many open files 异 常 


JNI 代 码 : 如 果 代 码 中 使 用 JNI 调 用 本 地 库 ， 那 本 地 库 使 用 的 内 存 也 
不 在 堆 中 。 


虚拟 机 和 GC: 虚拟 机 、GC 的 代码 执行 也 要 消耗 一 定 的 内 存 。 


5.2.4 外 部 命令 导致 系统 缓慢 


这 是 一 个 来 自 网 络 的 案例 : 一 个 数字 校园 应 用 系统 ， 运 行 在 一 台 4 
个 CPU 的 Solaris 10 操 作 系 统 上 ， 中 间 件 为 GlassFish 服 务 器 。 系 统 在 做 大 
并 发 压力 测试 的 时 候 ， 发 现 请 求 响应 时 间 比 较 慢 ， 通 过 操作 系统 的 
mpstat 工 具 发 现 CPU 使 用 率 很 高 ， 并 且 系 统 占用 绝 大 多 数 的 CPU 资源 的 
程序 并 不 是 应 用 系统 本 身 。 这 是 个 不 正常 的 现象 ， 通 常情 况 下 用 户 应 用 
的 CPU 占 用 率 应 该 占 主要 地 位 ， 才 能 说 明 系 统 是 正常 工作 的 。 





通过 Solaris 10 的 Dtrace 脚 本 可 以 查看 当前 情况 下 哪些 系统 调用 花费 
了 最 多 的 CPU 资源 ，Dtrace 运 行 后 发 现 最 消耗 CPU 资源 的 竟然 是 "fork" 系 
统 调用 。 众 所 周知 ，"fork" 系 统 调用 是 Linux 用 来 产生 新 进程 的 ， 在 Java 
虚拟 机 中 ， 用 户 编写 的 Java 代 码 最 多 只 有 线程 的 概念 ， 不 应 当 有 进程 的 
产生 。 





这 是 个 非常 异常 的 现象 。 通 过 本 系统 的 开发 人 员 ， 最 终 找到 了 答 
案 : 每 个 用 户 请 求 的 处 理 都 需要 执行 一 个 外 部 shell 脚 本 来 获得 系统 的 一 
息 。 执 行 这 个 shell 脚 本 是 通过 Java 的 Runtime.getRuntime().exec() 方 
法 来 调用 的 。 这 种 调用 方式 可 以 达到 目的 ， 但 是 它 在 Java 虚 拟 机 中 是 非 
常 消耗 资源 的 操作 ， 即 使 外 部 命令 本 身 能 很 快 执行 完毕 ， 频 繁 调用 时 创 
建 进程 的 开销 也 非常 可 观 。Java 虚 拟 机 执行 这 个 命令 的 过 程 是 : 首先 克 





隆 一 个 和 当前 虚拟 机 拥有 一 样 环境 变量 的 进程 ， 再 用 这 个 新 的 进程 去 执 
行 外 部 命令 ， 最 后 再 退出 这 个 进程 。 如 果 频 繁 执行 这 个 操作 ， 系 统 的 消 
耗 会 很 大 ， 不 仅 是 CPU， 内 存 负担 也 很 重 。 


用 户 根据 建议 去 掉 这 个 Shell 脚 本 执行 的 语句 ， 改 为 使 用 Java 的 API 
去 获取 这 些 信息 后 ， 系 统 很 快 恢复 了 正常 。 


5.2.5 ”服务 器 JVM 进 程 表 溃 


例如 ， 一 个 基于 B/S 的 MIS 系 统 ， 硬 件 为 两 台 2 个 CPU、8GB 内 存 的 
HP 系统 ， 服 务 器 是 WebLogic 9.2( 就 是 5.2.2 市 中 的 那 套 系统 ) 。 正 常 运 
行 一 段 时 间 后 ， 最 近 发 现在 运行 期 间 频繁 出 现 集群 节点 的 虚拟 机 进程 自 
动 天 闭 的 现象 ， 留 下 了 一 个 hs_err_pid###.log 文 件 后 ， 进 程 就 消失 了 ， 
两 台 物 理 机 器 里 的 每 个 节点 都 出 现 过 进程 骨 溃 的 现象 。 从 系统 日 志 中 可 
以 看 出 ， 每 个 节点 的 虚拟 机 进程 在 骨 溃 前 不 入， 都 发 生 过 大 量 相同 的 异 
常 ， 见 代码 清单 5-2。 











代码 清单 5-2 异常 堆栈 2 





Java.net.SocketException:Connection reset 

at java.net.SocketInputStream.read (SocketInputStream.java:168) 
at 

java.io.BufferedInputStream.fill (BufferedInputStream.java:218) 
at 

java.io.BufferedInputStream.read (BufferedInputStream.java:235) 
at 

org.apache.axis.transport.http.HTTPSender.readHeadersFromSocket (HTTPS 
at 

org.apache.axis.transport.nhnttp.HTTPSender.invoke (HTTPSender.java:143) 




















































































































这 是 一 个 远 端 断 开 连接 的 异常 ， 通 过 系统 管理 员 了 解 到 系统 最 近 与 
一 个 OA 门户 做 了 集成 ， 在 MIS 系 统 工 作 流 的 待 办 事项 变化 时 ， 要 通过 
Web 服 务 通知 OA 门户 系统 ， 把 竺 办 事项 的 变化 同步 到 OA 门户 之 中 。 


过 SoapUI 测 试 了 一 下 同步 待 办 事项 的 几 个 web 服务， 发 现 调 用 后 竟然 需 
要 长 达 3 分 钟 才能 返回 ， 并 且 返 回 结果 都 是 连接 中 断 。 


由 于 MIS 系 统 的 用 户 多 ， 竺 办 事项 变化 很 快 ， 为 了 不 被 OA 系统 速 
度 拖累 ， 使 用 了 异步 的 方式 调用 Web 服 务 ， 但 由 于 两 边 服 务 速度 的 完全 
不 对 等 ， 时 间 越 长 就 累积 了 越 多 Web 服 务 没有 调用 完成 ， 导 致 在 等 待 的 
线程 和 Socket 连 接 越 来 越 多 ， 最 终 在 超过 虚拟 机 的 承受 能 力 后 使 得 虚拟 
机 进程 衣 尝 。 解 决 方法 : 通知 OA 门户 方 修复 无 法 使 用 的 集成 接口 ， 并 
将 异步 调用 改 为 生产 者 /消费 者 模 陈 的 消息 队列 实现 后 ， 系 统 恢复 正 








亚 











5.2.6 不 恰当 数据 结构 导致 内 存 占用 过 大 


例如 ， 有 一 个 后 台 RPC 服 务 器 ， 使 用 64 位 虚拟 机 ， 内 存 配置 为 - 
Xms4g-Xmx8g-Xmnlg， 使 用 ParNew+CMS 的 收集 器 组 合 。 平 时 对 外 服 
务 的 Minor GC 时 间 约 在 30 腌 秒 以 内 ， 完 全 可 以 接受 。 但 业务 上 需要 每 10 
分 钟 加 载 一 个 约 80MB 的 数据 文件 到 内 存 进行 数据 分 析 ， 这 些 数据 会 在 
内 存 中 形成 超过 100 万 个 HashMap<Long,Long 之 Entry， 在 这 段 时 间 里 面 
Minor GC 了 就 会 造成 超过 500 坚 秒 的 停顿 ， 对 于 这 个 停顿 时 间 就 接受 不 了 
了 ， 有 具体 情况 如 下 面 GC 日 志 所 示 。 


























{Heap before GC invocations=95 (full 4) : 

par new generation total 903168K,used 803142K[0x00002aaaae770000， 
0x00002aaaebb70000，0x00002aaaebb70000) 

eden Space 802816K, 100%used[0x00002aaaae770000， 
0x00002aaadf770000,，0x00002aaadf770000) 
from space 100352K, 0%used[O0x00002aaae5970000,， 0x00002aaae59c1910， 
0x00002aaaebb70000) 
to space 100352K, 0%Sused[0x00002aaadf770000, 0x00002aaadf770000,， 
0x00002aaae5970000) 

concurrent mark-sweep generation total 5845540K,used 
3898978K[0x00002aaaebb70000，0x00002aac507f9000，0x00002aacae770000 ) 

concurrent-mark-sweep perm gen total 65536K,used 
40333K[0x00002aacae770000，0x00002aacb2770000，0x00002aacb2770000) 

2011-10-28 T11:40:45.162+0800:226.504: [GC226.504: [ParNew:803142K- 
>100352K (903168K) ，0.5995670 secs]4702120K- 二 4056332K (6748708K)， 
0.5997560 

Secs] [Times:user=1.46 sys=0.04, real=0.60 secs ] 

Heap after GC invocations=96 (full 4) : 

par new generation total 903168K,used 100352K[0x00002aaaae770000， 
0x00002aaaebpb70000，0x00002aaaebpb70000 ) 

eden Space 802816K, 0%used[0x00002aaaae770000,， 0x00002aaaae770000， 
0x00002aaadf770000) 
from space 100352K, 100%used[0x00002aaadf770000,， 
0x00002aaae5970000， 















































0x00002aaae5970000) 

to space 100352K, 0x00002aaaebb70000) 0%used[0x00002aaae5970000， 
0x00002aaae5970000， 

concurrent mark-sweep generation total 5845540K,used 
3955980K[0x00002aaaebb70000，0x00002aac507f9000，0x00002aacae770000 ) 

concurrent-mark-sweep perm gen total 65536K,used 
40333K[0x00002aacae770000，0x00002aacb2770000，0x00002aacb2770000) 

} 

Total time for which application threads were stopped:0.6070570 
seconds 


























观察 这 个 案例 ， 发 现 平时 的 Minor GC 时 间 很 短 ， 原 因 是 新 生 代 的 绝 
大 部 分 对 象 都 是 可 清除 的 ， 在 Minor GC 之 后 Eden 和 Survivor 基 本 上 处 于 
完全 空闲 的 状态 。 而 在 分 析 数 据 文件 期 间 ，800MB 的 Eden 空 间 很 快 被 填 
满 从 而 引发 GC， 但 Minor GC 之 后 ， 新 生 代 中 绝 大 部 分 对 象 依然 是 存活 
的 。 我 们 知道 ParNew 收 集 器 使 用 的 是 复制 算法 ， 这 个 算法 的 高 效 是 建 
立 在 大 部 分 对 象 都 “ 朝 生 夕 灭 ”的 特性 上 的 ， 如 果 存 活 对 象 过 多 ， 把 这 些 
对 象 复 制 到 Survivor 并 维持 这 些 对 象 引 用 的 正确 就 成 为 一 个 沉重 的 负 
担 ， 因 此 导致 GC 和 暂停 时 间 明 显 变 长 。 





如 果 不 修 改 程序 ， 仅 从 GC 调 优 的 角度 去 解决 这 个 问题 ， 可 以 考虑 
将 Survivor 空 间 去 掉 〈 加 入 参数 -XX:SurvivorRatio=65536、- 
XX:MaxTenuringThreshold=0 或 者 -XX:+AlwaysTenure) ， 让 新 生 代 中 存 
活 的 对 象 在 第 一 次 Minor GC 后 立即 进入 老年 代 ， 等 到 Major GC 的 时 候 
再 清理 它们 。 这 种 措施 可 以 治标 ， 但 也 有 很 大 副作用 ， 治 本 的 方案 需要 
修改 程序 ， 因 为 这 里 的 问题 产生 的 根本 原因 是 用 HashMap 二 Long,Long 
> 结构 来 存储 数据 文件 空间 效率 太 低 。 





下 面具 体 分 析 一 下 空间 效率 。 在 HashMap<Long,Long 之 结构 中 ， 
只 有 Key 和 Value 所 存放 的 两 个 长 整 型 数据 是 有 效 数 据 ， 共 
16B (2x8B) 。 这 两 个 长 整 型 数据 包装 成 java.lang.Long 对 象 之 后 ， 束 分 
别 具 有 8B 的 MarkWord、8B 的 Klass 指 针 ， 在 加 8B 存 储 数 据 的 long 值 。 在 
这 两 个 Long 对 象 组 成 Map.Entry 之 后 ， 又 多 了 16B 的 对 象 头 ， 然 后 一 个 
8B 的 next 字 段 和 4B 的 int 型 的 hash 字 段 ， 为 了 对 齐 ， 还 必须 添加 4B 的 空 日 
填充 ， 最 后 还 有 HashMap 中 对 这 个 Entry 的 8B 的 引用 ， 这 样 增加 两 个 长 
整 型 数字 ， 实 际 耗 费 的 内 存 为 (Long (24B) x2) +Entry (32B) 


+HashMap Ref (8B) =88B， 空 间 效率 为 16B/88B=18%， 实 在 太 低 了 。 


5.2.7 ”由 Windows 虚 拟 内 存 导 致 的 长 时 间 停 顿 H 


例如 ， 有 一 个 带 心跳 检测 功能 的 GUI 蝎 面 程序 ， 每 15 秒 会 发 送 一 次 
心跳 检测 信号 ， 如 果 对 方 30 秒 以 内 都 没有 信和 号 返回 ， 那 就 认为 和 对 方程 
序 的 连接 已 经 断 开 。 程 序 上 线 后 发 现 心跳 检测 有 误 报 的 概率 ， 查 询 日 志 
发 现 误 报 的 原因 是 程序 会 偶尔 出 现 间隔 约 一 分 钟 左右 的 时 间 完 全 无 日 志 
输出 ， 处 于 停顿 状态 。 








因为 是 桌面 程序 ， 所 需 的 内 存 并 不 大 〈-Xmx256m) ， 所 以 开始 并 
没有 想到 是 GC 导致 的 程序 停顿 ， 但 是 加 入 参数 - 
XX:+PrintGCApplicationStoppedTime-XX:+PrintGCDateStamps- 
Xloggc:gclog.log 后 ， 从 GC 日 志文 件 中 确认 了 停顿 确实 是 由 GC 导致 的 ， 
大 部 分 GC 时 间 都 控制 在 100 喀 秒 以 内 ， 但 偶尔 就 会 出 现 一 次 接近 1 分 钟 
的 GC。 


































































































Total time for which application threads were stopped:0.0112389 
seconds 

Total time for which application threads were stopped:0.0001335 
seconds 

Total time for which application threads were stopped:0.0003246 
seconds 

Total time for which application threads were stopped:41.4731411 
seconds 

Total time for which application threads were stopped:0.0489481 
seconds 

Total time for which application threads were stopped:0.1110761 
seconds 

Total time for which application threads were stopped:0.0007286 











seconds 


Total time for which application threads were stopped:0.0001268 
seconds 











从 GC 日 志 中 找到 长 时 间 停 顿 的 具体 日 志 信息 “添加 了 - 
XX:+PrintReferenceGC 参 数 ) ， 找 到 的 日 志 片 段 如 下 所 示 。 从 日 志 中 可 
以 看 出 ， 真 正 执行 GC 动作 的 时 间 不 是 很 长 ， 但 从 准备 开始 GC， 到 真正 
开始 GC 之 间 所 消耗 的 时 间 却 占 了 绝 大 部 分 





2012-08-29T19:14:30.968+0800:10069.800: [GC10099.225: 
[SoftReference, 0 refs, 0.0000109 secs]10099.226: [WeakReference, 4072 
refs, 0.0012099 secs]10099.227: [FinalReference, 984 refs, 1.5822450 
secs]10100.809: [PhantomReference, 251 refs, 0.0001394 secs]10100.809: 
[JNI Weak Reference, 0.0994015 secs] [PSYoungGen:175672K-> 
8528K (167360K) ]251523K- 记 100182K (353152K) ，31.1580402 secs] 
[Times:user=0.61 sys=0.52, real=31.16 secs|] 










































































除 GC 日 志 之 外 ， 还 观察 到 这 个 GUI 程序 内 存 变 化 的 一 个 特点 ， 当 它 
最 小 化 的 时 候 ， 资 源 管 理 中 显示 的 占用 内 存 大 幅度 减 小 ， 但 是 虚拟 内 存 
则 没有 变化 ， 因 此 怀疑 程序 在 最 小 化 时 它 的 工作 内 存 被 自动 交换 到 磁盘 
的 页 面 文件 之 中 了 ， 这 样 发 生 GC 时 就 有 可 能 因为 恢复 页 面 文件 的 操作 
而 导致 不 正常 的 GC 停顿 。 





在 MSDN 上 查证 号 后 确认 了 这 种 猜想 ， 因 此 ， 在 Java 的 GUI 程序 中 
要 避免 这 种 现象 ， 可 以 加 入 参数 "- 
Dsun.awt.keepWorkingSetOnMinimize=true" 来 解决 。 这 个 参数 在 许多 
AWT 的 程序 上 都 有 应 用 ， 例 如 JDK 自 带 的 Visual VM， 用 于 保证 程序 在 
恢复 最 小 化 时 能 够 立即 响应 。 在 这 个 案例 中 加 入 该 参数 后 ， 问 题 得 到 解 





决 。 


[1 本 案例 来 源 于 HLLVM 组 群 的 讨论 : 
http:/ /hllvm.group.iteye.com/ group/topic/28745。 


[2]http:/ /suppott.mictosoft.com/ default.aspx?scid=kb;en-us;293215。 





5.3 ”实战 : Eclipse 运行 速度 调 优 


很 多 Java 开 及 人 员 都 有 这 样 一 种 观念 : 系统 调 优 的 工作 都 是 针对 服 
务 端 应 用 而 言 ， 规 模 越 大 的 系统 ， 就 越 需要 专业 的 调 优 运 维 团队 参与 。 
这 个 观点 不 能 说 不 对 ，5.2 节 中 笔者 所 列举 的 案例 确实 都 是 服务 问 运 
维 、 调 优 的 例子 ， 但 服务 端 应 用 需要 调 优 ， 并 不 次 明 其 他 应 用 就 不 需要 
了 ， 作 为 一 个 普通 的 Java 开 发 人 员 ， 前 面 讲 的 各 种 虚拟 机 的 原理 和 最 佳 
实践 方法 距离 我 们 并 不 遥远 ， 开 发 者 身边 很 多 场景 都 可 以 使 用 上 面 这 些 
知识 。 下 面 通 过 一 个 普通 程序 员 日 党 工作 中 可 以 随时 接触 到 的 开发 工具 


开始 这 次 实战 。 








5.3.1 调 优 前 的 程序 运行 状态 


笔者 使 用 Eclipse 作 为 日 常 工作 中 的 主要 IDE 工 具 ， 由 于 安装 的 插件 
比较 大 (如 Klocwork、ClearCase LT 等 ) 、 代 码 也 很 多 ， 启 动 Eclipse 直 
到 所 有 项 目 编译 完成 需要 四 五 分 钟 。 一 直 对 开发 环境 的 速度 感觉 不 满 
意 ， 趁 肴 编写 这 本 书 的 机 会 ， 决 定 对 Eclipse 进行 “ 动 刀 ” 调 优 。 











笔者 机 器 的 Eclipse 运行 平台 是 32 位 Windows 7 系统 ， 虚 拟 机 为 
HotSpot VM 1.5 b64。 硬 件 为 ThinkPad X201，Intel i5 CPU，4GB 物 理 内 
存 。 在 初始 的 配置 文件 eclipse.ini 中 ， 除 了 指定 JDK 的 路 径 、 设 置 最 大 堆 


为 512MB 以 及 开启 了 JMX 管 理 〈 需 要 在 VisualVM 中 收集 原始 数据 ) 
外 ， 未 做 其 他 任何 改动 ， 原 始 配 置 内 容 如 代码 清单 5-3 所 示 。 


代码 清单 5-3 Eclipse 3.5 初 始 配置 





—vm 
D:/ DevSpace/jdkl1.5.0/bin/javaw.exe 

-startup 
plugins/org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
--launcher.library 
plugins/org.eclipse.equinox.launcher.win32.win32.x86 1.0.200.v2009 
-product 

org.eclipse.epp.package.Jjee.product 

--launcher .XXMaxPermSize 

256M 

-showsplash 

org.eclipse.platform 

-vmargs 

-Dosgi .requiredJavaVersion=1.5 

—Xmx512m 

-Dcom.sun.management .jmxremote 























为 了 要 与 调 优 后 的 结果 进行 量化 对 比 ， 调 优 开 始 前 笔者 先 做 了 一 次 
初始 数据 测试 。 测 试用 例 很 简单 ， 就 是 收集 从 Eclipse 启动 开始 ， 直 到 所 
有 插件 加 载 完成 为 止 的 总 耗 时 以 及 运行 状态 数据 ， 虚 拟 机 的 运行 数据 通 
过 VisualVM 及 其 扩展 插件 VisualGC 进 行 采 集 。 测 试 过 程 中 反复 启动 数 
次 Eclipse 直到 测试 结果 稳定 后 ， 取 最 后 一 次 运行 的 结果 作为 数据 样本 
(为 了 避免 操作 系统 未 能 及 时 进行 磁盘 缓存 而 产生 的 影响 ) ， 数 据 样本 
如 图 5-2 所 示 。 
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图 5-2 Eclipse 原始 运行 数据 


Surviver 1 (3.938W, 1.250W): 0 























Eclipse 启动 的 总 耗 时 没有 办 法 从 监控 工具 中 直接 获得 ， 因 为 
VisualVM 不 可 能 知道 Eclipse 运行 到 什么 阶段 算是 局 动 完成 。 为 了 测试 的 
准确 性 ， 笔 者 写 了 一 个 简单 的 Eclipse 插件 ， 用 于 统计 Eclipse 的 启动 耗 
时 。 由 于 代码 很 简单 ， 并 且 本 书 不 是 Eclipse RCP 开 发 的 教程 ， 所 以 只 列 
出 代码 清单 5-4 供 读者 参考 ， 不 再 延伸 讲解 。 如 果 读 者 需要 这 个 插件 ， 

可 以 使 用 下 面 代码 自行 编译 或 者 发 电子 邮件 向 笔者 索取 。 








代码 清单 5-4 Eclipse 启动 耗 时 统计 插件 





ShowTime .java 代 码 : 
import org.eclipse.jface.dialogs.MessageDialog; 
import org.eclipse.swt.widgets.Display; 
































Import org.eclipse.swt.widgets.Shell; 
Import ord.eclipse.ui.IStartupi 
/** 


* 统 计 Eclipse 启 动 耗 时 


*Qauthor zzm 








public class ShowTime implements IStartupt{ 
public void earlyStartup(){ 
D 
p 











isplay.getDefault () .syncExec (new Runnable (){ 

ublic void run()t{ 

long 

eclipseStartTime=Long.parseLong (System.getProperty ("eclipse.startTim 
long costTime=System.currentTimeMillis()-eclipseStartTime; 
Shell shell=Display.getDefault() .getActiveShell (); 

String message="Eclipse 启 动 耗 时 : "+costTimet"ms"; 
MessageDialog.openInformation (shell, "Information", message); 
} 

}); 

} 

} 

plugin.xml 代 码 : 

<?xml version="1.0"encoding="UTF-8"?> 

<?eclipse version="3.4"?> 

<plugin> 

<extension 

point="org.eclipse.ui.startup"> 

<startup class="eclipsestarttime.actions.ShowTime"/> 
</extension> 

</plugin> 






























































上 述 代 码 打 包 成 jar 后 放 到 Eclipse 的 plugins 目 录 ， 反 复 启 动 几 次 后 ， 
插件 显示 的 平均 时 间 稳 定 在 15 秒 左右 ， 如 图 5-3 所 示 。 


0 Eclipse 所 动 耗 时 : 15896ms 





图 5-3 耗 时 统计 播 件 运行 效果 


根据 VisualGC 和 Eclipse 插件 收集 到 的 信息 ， 总 结 原始 配置 下 的 测试 
结果 如 下 。 


整个 启动 过 程 平均 耗 时 约 15 秒 。 





最 后 一 次 启动 的 数据 样本 中 ， 垃 圾 收集 总 耗 时 4.149 秒 ， 其 中 : 
eFull GC 被 触发 了 19 次 ， 共 耗 时 3.166 秒 。 

eMinor GC 被 触发 了 378 次 ， 共 耗 时 0.983 秒 。 

加 载 类 9115 个 ， 耗 时 4.114 秒 。 

JIT 编 译 时 间 为 1.999 秒 。 


虚拟 机 512MB 的 堆 内 存 被 分 配 为 40MB 的 新 生 代 31.5 的 Eden 空 间 
和 两 个 4MB 的 Surviver 空 间 ) 以 及 472MB 的 老年 代 。 


客观 地 说 ， 由 于 机 器 硬件 还 不 错 〈 请 读者 以 2010 年 普通 PC 机 的 标 
准 来 衡量 ) ，15 秒 的 启动 时 间 其 实 还 在 可 接受 范围 以 内 ,但 是 从 

VisualGC 中 反映 的 数据 来 看 ， 主 要 问题 是 非 用 户 程序 时 间 (图 5-2 中 的 
Compile Time、Class Load Time、GC Time) 非常 之 高 ， 占 了 整个 启动 
过 程 耗 时 的 一 半 以 上 (这 里 存在 少许 夸张 成 分 ， 因 为 如 JIT 编 译 等 动作 
是 在 后 台 线程 完成 的 ， 用 户 程 序 在 此 期 间 也 正常 执行 ， 所 以 并 没有 占用 











了 一 半 以 上 的 绝对 时 间 ) 。 虚 拟 机 后 人 台 占 用 太 多 时 间 也 直接 导致 Eclipse 
在 局 动 后 的 使 用 过 程 中 经 党 有 不 时 停顿 的 感觉 ， 所 以 进行 调 优 有 较 大 的 
价值 。 








5.3.2 ”升级 JDK 1.6 的 性 能 变化 及 兼容 问题 


对 Eclipse 进行 调 优 的 第 一 步 就 是 先 把 虚拟 机 的 版 本 进行 升级 ， 和 希望 
能 先 从 虚拟 机 版 本 映 上 得 到 一 些 “ 免 费 的 ”性 能 提升 。 








每 次 JDK 的 大 版 本 发 布 时 ， 开 发 商 肯定 都 会 宣称 虚拟 机 的 运行 速度 
比 上 一 版 本 有 了 很 大 的 提高 ， 这 虽然 是 个 广告 性 质 的 宣言 ， 经 常 被 人 从 
升级 列表 或 者 技术 白皮书 中 直接 忽略 过 去 ， 但 从 国内 外 的 第 三 方 评测 数 
据 来 看 ， 版 本 升级 至 少 某 些 方面 确实 带 来 了 一 定 的 性 能 改善 由， 以 下 是 
一 个 第 三 方 网 站 对 JDK 1.5、1.6、1.7 三 个 版 本 做 的 性 能 评测 ， 分 别 测 试 
了 以 下 4 个 用 例 呈 1: 


生成 500 万 个 的 字符 串 。 
500 万 次 ArrayList< String 之 数据 插入 ， 使 用 第 一 点 生成 的 数据 。 


生成 500 万 个 HashMap<String,Integer 盖 ， 每 个 键 - 值 对 通过 并 发 线 
程 计 算 ， 测 试 并 发 能 


打印 500 万 个 ArrayList< String 之 中 的 值 到 文件 ， 并 重读 回 内 存 。 


三 个 版 本 的 JDK 分 别 运行 这 3 个 用 例 的 测试 程序 ， 测 试 结果 如 图 5-4 
所 示 。 


Time (ms) 30000 





java 1.7 
java 1.6 
java 1.5 








图 5-4 JDK 横 向 性 能 对 比 


从 这 4 个 用 例 的 测试 结果 来 看 ，JDK 1.6 比 JDK 1.5 有 大 约 15% 的 性 能 
提升 ， 尽 管 对 JDK 仅 测试 这 4 个 用 例 并 不 能 说 明 什么 问题 ， 需 要 通过 测 
试 数 据 来 量化 描述 一 个 JDK 比 旧版 提升 了 多 少 是 很 难 做 到 非常 科学 和 准 
确 的 (要 做 稍微 靠 谱 一 点 的 测试 ， 可 以 使 用 SPECjvm2008 中 来 完成 ， 或 
者 把 相应 版 本 的 TCKI4 中 数 万 个 测试 用 例 的 性 能 数据 对 比 一 下 可 能 更 有 
说 服 力 ) ， 但 我 还 是 选择 相信 这 次 * 软 广告 ?性 质 的 测试 ， 把 JDK 版 本 升 
级 到 1.6 Update 21。 


与 所 有 小 说 作者 设计 的 故事 情节 一 样 ， 获 得 最 后 的 胜利 之 前 总 是 要 


经 历 各 种 各 样 的 挫折 ， 这 次 升级 到 JDK 1.6 之 后 ， 性 能 有 什么 变化 先 暂 
是 不 谈 ， 在 使 用 几 分 钟 之 后 ， 笔 者 的 Edipse 就 和 前 面 几 个 服务 端的 案例 
一 样 非常 < 不负众望 ”地 发 生 了 内 存 溢出 ， 如 图 5-5 所 示 。 


'@) Internal Error 


1 An out of memory error has oceurred. Consult the "Runnine Eclipse”sectior 
| | of the read me file for information on preventine this kind of error in the 
st future. 

You are recommended to exit the workbench. 

Subsequent errors may happern ard may terminate the workbench without 

Warning. 

See the .log file for more details. 


Do you want to exit the workbench? 





图 5-5 Eclipse OutOfMemoryError 


这 次 内 存 洲 出 完全 出 乎 笔者 的 意料 之 外 : 决定 对 Eclipse 做 调 优 是 因 
为 速度 慢 ， 但 开发 环境 一 直 都 很 稳定 ， 至 少 没有 出 现 过 内 存 溢出 的 问 
题 ， 而 这 次 升级 除了 eclipse.ini 中 的 JVM 路 径 改 变 了 之 外 ， 还 未 进行 任何 
运行 参数 的 调整 ， 进 到 Eclipse 主 界面 之 后 随便 打开 了 几 个 文件 就 抛 出 内 
存 溢出 异常 了 ， 难 道 JDK 1.6 Update 21 有 哪个 API 出 现 了 严重 的 泄漏 问 


题 吗 ? 











事实 上 ， 并 不 是 JDK 1.6 出 现 了 什么 问题 ， 根 据 前 面 章 节 中 介绍 的 
相关 原理 和 工具 ， 我 们 要 查 明 这 个 异常 的 原因 并 且 解 决 它 一 点 也 不 困 
难 。 打 开 VisualVM， 监 视 页 签 中 的 内 存 曲 线 部 分 如 图 5-6 和 图 5-7 所 示 。 





320, 815, 104 个 字 节 
536. 870, 912 个 字 节 


31 


国 堆 大 小 国 使 用 的 堆 





图 5-6 Java 堆 监视 曲线 


66, 584, 576 个 字 节 已 使 用 : 66, 459, 952 个 字 节 
67, 108, 864 个 字 节 


4:28 
国 Fermcen 大 小 国 使 用 的 PermGen 





图 5-7 永久 代 监 视 曲 线 


在 Java 堆 中 监视 曲线 中 ,“ 堆 大 小 ”的 曲线 与 “使 用 的 堆 * 的 曲线 一 下 
都 有 很 大 的 间隔 距离 ， 每 当 两 条 曲线 开始 有 互相 靠近 的 趋势 时 , “最 大 
堆 ” 的 曲线 就 会 快速 同上 转身， 而 “使 用 的 堆 ? 的 曲线 会 癌 下 转向 。 “最 大 
堆 ? 的 曲线 同上 是 虚拟 机 内 部 在 进行 扒 扩容 ， 运 行 参数 中 并 没有 指定 最 
小 堆 〈-Xms) 的 值 与 最 大 堆 〈-Xmx) 相等 ， 所 以 堆 容 量 一 开始 并 没有 
扩展 到 最 大 值 ， 而 是 根据 使 用 情况 进行 伸缩 扩展 。“ 使 用 的 堆 ”* 的 曲线 问 
下 是 因为 虚拟 机 内 部 触发 了 一 次 垃圾 收集 ， 一 些 废弃 对 象 的 空间 被 回收 
后 ， 内 存 用 量 相应 减少 ， 从 图 形 上 看 ，Java 堆 运作 是 完全 正常 的 。 但 永 
入 代 的 监视 曲线 就 有 问题 了 , “PermGen 大 小 ”的 曲线 与 “使 用 的 
PermGen” 的 曲线 几乎 完全 重合 在 一 起 ， 这 说 明永 久 代 中 没有 可 回收 的 
资源 ， 所 以 “使 用 的 PermGen” 的 曲线 不 会 同 下 发 展 ， 永 久 代 中 也 没有 空 
间 可 以 扩展 ， 所 以 “PermGen 大 小 ”的 曲线 不 能 同上 扩展 。 这 次 内 存 洲 出 
很 明显 是 永久 代 导 致 的 内 存 洲 出 。 




















再 注意 到 图 5-7 中 永久 代 的 最 大 容量 : “67，108，864 个 字 节 ” 也 
就 是 64MB， 这 恰好 是 JDK 在 未 使 用 -XX:MaxPermSize 参 数 明 确 指 定 永久 
代 最 大 容量 时 的 默认 值 ， 无 论 JDK 1.5 还 是 JDK 1.6， 这 个 默认 值 都 是 
64MB。 对 于 Eclipse 这 种 规模 的 Java 程 序 来 说 ，64MB 的 永久 代 内 存 空 间 
显然 是 不 够 的 ， 洲 出 很 正常 ， 那 为 何在 JDK 1.5 中 没有 发 生 过 溢出 呢 ? 





在 VisualVM 的 “概述 -JVM 参 数 ” 页 签 中 ， 分 别 检查 使 用 JDK 1.5 和 


JDK 1.6 运 行 Eclipse 时 的 JVM 人 参数 ， 发 现 使 用 JDK 1.6 时 ， 只 有 以 下 3 个 
JVM 参 数 ， 如 代码 清单 5-5 所 示 。 


代码 清单 5-5” JDK 1.6 的 Eclipse 运行 期 参数 


VS 





-Dcom.sun.management .jmxremote 
-Dosgi .requiredJavaVersion=1.5 
—Xmx512m 





而 使 用 JDK 1.5 运 行 时 ， 就 有 4 条 JVM 参 数 ， 其 中 多 出 来 的 一 条 正好 
就 是 设置 永久 代 最 大 容量 的 -XX:MaxPermSize=256M， 如 代码 清单 5-6 所 


小 。 


代码 清单 5-6 JDK 1.5 的 Eclipse 运行 期 参数 





-Dcom.sun.management .]jmxremote 
-Dosgi .requiredJavaVersion=1.5 
-Xmx512m 

-XX:MaxPermSize=256M 





为 什么 会 这 样 呢 ? 笔者 从 Eclipse 的 Bug List 网 站 I 上 找到 了 答案 
使 用 JDK 1.5 时 之 所 以 有 永久 代 容 量 这 个 参数 ， 是 因为 在 eclipse.ini 中 存 


在 "--launcher.XXMaxPermSize 256M" 这 项 设置 ， 当 launcher 也 就 是 








Windows 下 的 可 执行 程序 eclipse.exe， 检 测 到 假如 是 Eclipse 运行 在 Sun 公 
司 的 虚拟 机 上 的 话 ， 就 会 把 参数 值 转 化 为 -XX:MaxPermSize 传 递 给 虚拟 
机 进程 ， 因 为 三 大 商用 虚拟 机 中 只 有 Sun 系 列 的 虚拟 机 才 有 永久 代 的 概 
念 ， 也 就 是 只 有 HotSpot 虚 拟 机 需要 设置 这 个 参数 ， 了 Rockit 虚 拟 机 和 


IBM J9 虚 拟 机 都 不 需要 设置 。 





在 2009 年 4 月 20 日 ，Oracle 公 司 正 式 完成 了 对 Sun 公 司 的 收购 ， 此 后 
无 论 是 网 页 还 是 具体 程序 产品 ， 提 供 商都 从 Sun 变 为 了 Oracle， 而 
eclipse.exe 就 是 根据 程序 提供 商 判 断 是 否 为 Sun 的 虚拟 机 ， 当 JDK 1.6 
Update 21 中 java.exe、javaw.exe 的 "Company" 属 性 从 "Sun Microsystems 
Inc." 变 为 "Oracle Corporation" 之 后 ，Eclipse 就 完全 不 认识 这 个 虚拟 机 
了 ， 因 此 没有 把 最 大 永久 代 的 参数 传递 过 去 。 











了 解 原因 之 后 ， 解 决 方法 就 简单 了 ，launcher 不 认识 就 只 好 由 人 来 
告诉 它 ， 即 在 eclipse.ini 中 明确 指定 -XX:MaxPermSize=256M 这 个 参数 就 
可 以 了 。 


[1 版 本 升级 也 有 不 少 性 能 倒退 的 案例 ， 受 程序 、 第 三 方 包 兼容 性 以 及 中 
间 件 限制 ， 在 企业 应 用 中 升级 JDK 版 本 是 一 件 需 要 慎重 考虑 的 事情 。 

2 测试 用 例 、 数 据 及 图 片 来 自 : http://geeknizer.com/java-7-whats-new- 
performance-benchmatk-1-5-1-6-1-7 

[3 引 官 方 网 站 : http://www.spec.org/jvm2008/docs/UserGuide.html。 

[ITCK (Technology Compatibility Kit) 是 一 套 由 一 组 测试 用 例 和 相应 的 
测试 工具 组 成 的 工具 包 ， 用 于 保证 一 个 使 用 Java 技 术 的 实现 能 够 完全 遵 
守 其 适用 的 Java 平 台 规 范 ， 并 且 符 合 相 应 的 参考 实现 。 


[Slhttps://bugs.eclipse.org/bugs/show_bug.cgi?id=319514。 


5.3.3 ”编译 时 间 和 类 加 载 时 间 的 优化 


从 Eclipse 启动 时 间 上 来 看 ， 升 级 到 JDK 1.6 所 带 来 的 性 能 提升 
是 ...... 咽 ? 基本 上 没有 提升 ?多 次 测试 的 平均 值 与 JDK 1.5 的 差距 完全 
在 实验 误差 范围 之 内 。 


各 位 读者 不 必 失 望 ，Sun JDK 1.6 性 能 白皮书 凯 描 述 的 众多 相对 于 
JDK 1.5 的 提升 不 至 于 全 部 是 广告 ， 昌 然 总 启动 时 间 没 有 减少 ， 但 在 查 
看 运行 细节 的 时 候 ， 却 发 现 了 一 件 很 值得 注意 的 事情 : 在 JDK 1.6 中 启 
动 完 Eclipse 所 消耗 的 类 加 载 时 间 比 JDK 1.5 长 了 接近 一 倍 ， 不 要 看 反 
了 ， 这 里 写 的 是 JDK 1.6 的 类 加 载 比 JDK 1.5 慢 一 倍 ， 测 试 结果 如 代码 清 
单 5-7 所 示 ， 反 复 测 试 多 次 仍然 是 相似 的 结果 。 














代码 清单 5-7 JDK 1.5 和 JDK 1.6 中 的 类 加 载 时 间 对 比 





使 用 JDK 1 .6 的 类 加 载 时 间 : 
C:\Users\IcyFenix>jps 
8552 
6372 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
6900 Jps 
C:\Users\IcyFenix~>jstat-class 6372 

Loaded Bytes Unloaded Bytes Time 

71917 下 0180 .3 0 O00 8 18 

使 用 JDK 1.5 的 类 加 载 时 间 : 

C:\Users\IcyFenix>jps 

35352 

T2272. .JPS 

7216 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
C:\Users\IcyFenix~>jstat-class 7216 

Loaded Bytes Unloaded Bytes Time 
































7902 9691.2 3 2.6 4.34 








在 本 例 中 ， 类 加 载 时 间 上 的 差距 并 不 能 作为 一 个 具有 普遍 性 的 测试 
结果 去 说 明 JDK 1.6 的 类 加 载 必然 比 JDK 1.5 慢 ， 笔 者 测试 了 自己 机 器 上 
的 Tomcat 和 GlassFish 启 动 过 程 ， 并 未 没有 出 现 类 似 的 差距 。 在 国内 最 大 
的 Java 社 区 中 ， 笔 者 发 起 过 关于 此 问题 的 讨论 小， 从 参与 者 反馈 的 测试 
结果 来 看 ， 此 问题 只 在 一 部 分 机 器 上 存在 ， 而 且 JDK 1.6 的 各 个 Update 
版 之 间 也 存在 很 大 差异 。 





多 次 试验 后 ， 笔 者 发 现在 机 器 上 两 个 JDK 进 行 类 加 载 时 ， 字 节 码 验 
证 部 分 耗 时 差距 尤其 严重 。 考 虑 到 实际 情况 : Eclipse 使 用 者 其 多 ， 它 的 
编译 代码 我 们 可 以 认为 是 可 靠 的 ， 不 需要 在 加 载 的 时 候 再 进行 字 节 码 验 
证 ， 因 此 通过 参数 -Xverify:none 禁 止 掉 字 节 码 验证 过 程 也 可 作为 一 项 优 
化 措施 。 加 入 这 个 参数 后 ， 两 个 版 本 的 JDK 类 加 载 速度 都 有 所 提高 ， 
JDK 1.6 的 类 加 载 速度 仍然 比 JDK 1.5 慢 ， 但 是 两 者 的 耗 时 已 经 接近 了 许 
多 ， 测 试 数据 如 代码 清单 5-8 所 示 。 关 于 类 与 类 加 载 的 话题 ， 壁 如 刚刚 
提 到 的 字 节 码 验 证 是 怎么 回 事 ， 本 书 专 门 规划 了 两 个 章节 进行 详细 讲 
解 ， 在 此 不 再 延伸 讨论 。 








代码 清单 5-8 JDK 1.5 和 JDK 1.6 中 取消 字 节 码 验 证 后 的 类 加 载 时 间 
对 比 





使 用 JDK 1.6 的 类 加 载 时 间 : 
C:\Users\IcyFenix>jps 
5512 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 








5596 Jps 

C:\Users\IcyFenix>jstat-class 5512 

Loaded Bytes Unloaded Bytes Time 

6749 8837.0 0 0.0 3.94 

使 用 JDK 1.5 的 类 加 载 时 间 : 

C:\Users\IcyFenix>jps 

4724 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
5412 Jps 
C:\Users\IcyFenix>jstat-class 4724 
Loaded Bytes Unloaded Bytes Time 
6885391097 "3 2%.0 .3.10 


























在 取消 字 节 码 验 证 之 后 ，JDK 1.5 的 平均 启动 下 降 到 了 13 秒 ， 而 JDK 
1.6 的 测试 数据 平均 比 JDK 1.5 快 1 秒 ， 下 降 到 平均 12 秒 左右 ， 如 图 5-8 所 
示 。 在 类 加 载 时 间 仍 然 落后 的 情况 下 ， 依 然 可 以 看 到 JDK 1.6 在 性 能 上 
比 JDK 1.5 稍 有 优势 ， 说 明 至 少 在 Eclipse 启动 这 个 测试 用 例 上 ， 升 级 JDK 
版 本 确实 能 带 来 一 些 “ 免 费 的 ”性 能 提升 。 


0 Eclipse 启动 耗 时 ; 12589ms 
| 





图 5-8 运行 在 IDK 1.6 下 取消 字 节 码 验证 的 启动 时 间 


前 面 说 过 ， 除 了 类 加 载 时 间 以 外 ， 在 VisualGC 的 监视 曲线 中 显示 了 
两 项 很 大 的 非 用 户 程 序 耗 时 : 编译 时 间 (Compile Time) 和 垃圾 收集 时 
间 (GC Time) 。 世 圾 收集 时 间 读 者 应 该 非常 清楚 了 ， 而 编译 时 间 是 什 
么 呢 ? 程序 在 运行 之 前 不 是 已 经 编译 了 吗 ? 虚拟 机 的 JIT 编 译 与 垃圾 收 














集 一 样 ， 是 本 书 的 一 个 重要 部 分 ， 后 面 有 专门 章节 讲解 ， 这 里 先 简单 介 
绍 一 下 : 编译 时 间 是 指 虚 拟 机 的 JIT 编 译 器 (Just In Time Compiler) 编 
译 热 点 代码 (Hot Spot Code〉 的 耗 时 。 我 们 知道 Java 语 言 为 了 实现 跨 平 
台 的 特性 ，Java 代 码 编译 出 来 后 形成 的 Class 文 件 中 存储 的 是 字 节 码 
(ByteCode) ， 虚 拟 机 通过 解释 方式 执行 字 节 人 码 命令 ， 比 起 C/C++ 编译 
成 本 地 二 进 制 代码 来 说 ， 速 度 要 慢 不 少 。 为 了 解决 程序 解释 执行 的 速度 
问题 ，JDK 1.2 以 后 ， 虚 拟 机 内 置 了 两 个 运行 时 编译 嚣 中， 如 果 一 段 Java 
方法 被 调用 次 数 达到 一 定 程度 ， 就 会 被 判定 为 热 代 码 交 给 JIT 编 译 器 即 
时 编译 为 本 地 代码 ， 提 高 运行 速度 〈 这 就 是 HotSpot 虚 拟 机 名 字 的 由 
来 ) 。 甚 至 有 可 能 在 运行 期 动态 编译 比 C/C++ 的 编译 期 静态 译 编 出 来 的 
代码 更 优秀 ， 因 为 运行 期 可 以 收集 很 多 编译 器 无 法 知道 的 信息 ， 甚 至 可 
以 采用 一 些 很 激进 的 优化 手段 ， 在 优化 条 件 不 成 立 的 时 候 再 逆 优 化 退回 
来 。 所 以 Java 程 序 只 要 代码 没有 问题 (主要 是 泄漏 问题 ， 如 内 存 泄漏 、 
连接 泄漏 ) ， 随 着 代码 被 编译 得 越 来 越 彻 底 ， 运 行 速度 应 当 是 越 运行 越 
快 的 。Java 的 运行 期 编译 最 大 的 缺点 就 是 它 进行 编译 需要 消耗 程序 正常 
的 运行 时 间 ， 这 也 就 是 上 面 所 说 的 “编译 时 间 ”。 



































虚拟 机 提供 了 一 个 参数 -Xint 茜 止 编译 器 运作 ， 强 制 虚拟 机 对 字 节 码 
采用 纯 解 释 方式 执行 。 如 果 读 者 想 使 用 这 个 参数 省 下 Eclipse 局 动 中 那 2 
秒 的 编译 时 间 获 得 一 个 “更 好 看 ”的 成 绩 的 话 ， 那 八 介 要 失望 了 ， 加 上 这 
个 参数 之 后 ， 虽 然 编 译 时 间 确 实 下 降 到 0， 但 Eclipse 月 动 的 总 时 间 剧 增 
到 27 秒 。 看 来 这 个 参数 现在 最 大 的 作用 似乎 融 是 让 用 户 怀 念 一 下 JDK 


1.2 之 前 那 令 人 心酸 和 心 碎 的 运行 速度 。 





与 解释 执行 相对 应 的 另 一 方面 ， 虚 拟 机 还 有 力度 更 强 的 编译 器 : 当 
虚拟 机 运行 在 -client 模 式 的 时 候 ， 使 用 的 是 一 个 代号 为 C1 的 轻 量 级 编译 
器 ， 另 外 还 有 一 个 代号 为 C2 的 相对 重量 级 的 编译 器 能 提供 更 多 的 优化 措 
0 
时 从 VisualGC 可 以 看 到 启动 过 程 中 虚拟 机 使 用 了 超过 15 秒 的 时 间 去 进 
A C2 编译 器 
所 消耗 的 额外 编译 时 间 最 终 还 是 会 在 运行 速度 的 提升 之 中 赚 回 来 ， 这 样 
使 用 -server 模 式 也 是 一 个 不 错 的 选择 。 不 过 至 少 在 本 次 实战 中 ， 我 们 还 
是 继续 选用 -client 虚 拟 机 来 运行 Eclipse。 








[http:/ /www.oracle.com/technetwork/java/6-performance-137236.html。 

加 关于 JD 区 1.6 与 JDK 1.5 在 Eclipse 启动 时 类 加 载 速 度 差 异 的 讨论 : 
http:/ /www.iteye.com/topic/ 826542。 

DB3JDK 1.2 之 前 也 可 以 使 用 外 挂 JIT 编 译 器 进行 本 地 编译 ,但 只 能 与 解释 
器 二 选 其 一 ， 不 能 同时 工作 。 


5.3.4 调整 内 存 设置 控制 垃圾 收集 频率 





三 大 块 非 用 户 程序 时 间 中 ， 还 剩 下 GC 时 间 没 有 调整 ， 而 GC 时 间 却 
又 是 其 中 最 重要 的 一 块 ， 并 不 只 是 因为 它 是 耗 时 最 长 的 一 块 ， 更 因为 它 
是 一 个 稳定 持续 的 过 程 。 由 于 我 们 做 的 测试 是 在 测 程序 的 局 动 时 间 ， 所 
以 类 加 载 和 编译 时 间 在 这 项 测试 中 的 影响 力 被 大 幅度 放大 了 。 在 绝 大 多 
数 的 应 用 中 ， 不 可 能 出 现 持 续 不 断 的 类 被 加 载 和 弛 载 。 在 程序 运行 一 段 
时 间 后 ， 热 点 方法 被 不 断 编译 ， 新 的 热点 方法 数量 也 总 会 下 降 ， 但 是 垃 
圾 收集 则 是 随 着 程序 运行 而 不 断 运作 的 ， 所 以 它 对 性 能 的 影响 才 显 得 万 











在 Edlipse 启 动 的 原始 数据 样本 中 ， 短 短 15 秒 ， 类 共 发 生 了 19 次 Full 
GC 和 378 次 Minor GC， 一 共 397 次 GC 共 造 成 了 超过 4 秒 的 停顿 ， 也 就 是 
超过 1/4 的 时 间 都 是 在 做 垃圾 收集 ， 这 个 运行 数据 看 起 来 实在 太 粳 糕 
Ta 


首先 来 解决 新 生 代 中 的 Minor GC， 虽 然 GC 的 总 时 间 只 有 不 到 1 秒 ， 
但 却 发 生 了 378 次 之 多 。 从 VisualGC 的 线程 监视 中 看 到 ，Eclipse 启 动 期 
间 一 共 发 起 了 超过 70 条 线程 ， 同 时 在 运行 的 线程 数 超过 25 条 ， 每 当 发 生 
一 次 垃圾 收集 动作 ， 所 有 用 户 线程 都 必须 跑 到 最 近 的 一 个 安全 点 
《SafePoint) 然后 挂 起 线程 等 待 垃 圾 回收 。 这 样 过 于 频繁 的 GC 就 会 导 








致 很 多 没有 必要 的 安全 点 检测 、 线 程 挂 起 及 恢复 操作 。 





新 生 代 GC 椭 沉 发 生 ， 很 明显 是 由 于 虚拟 机 分 配给 新 生 代 的 空间 太 
小 而 导致 的 ，Eden 区 加 上 一 个 Survivor 区 还 不 到 35MB 。 因 此 很 有 必要 使 
用 -Xmn 参 数 调整 新 生 代 的 大 小 。 


再 来 看 一 看 那 19 次 Full GC， 看 起 来 19 次 并 “不 多 ”( 相 对 于 378 次 


Minor GC 来 说 )， 但 总 耗 时 为 3.166 秒 ， 





占 了 GC 时 间 的 绝 大 部 分 ， 降 低 


GC 时 间 的 主要 目标 就 要 降低 这 部 分 时 间 。 从 VisualGC 的 曲线 图 上 可 能 
看 得 不 够 精确 ， 这 次 直接 从 GC 日 志 呈 中 分 析 一 下 这 些 Full GC 是 如 何 产 
生 的 ， 代 码 清单 5-9 中 是 启动 最 开始 的 2.5 秒 内 发 生 的 10 次 Full GC 记录 。 


代码 清单 5-9 Full GC 记录 





0.278: [GC 0.278: [De 
[Tenured:1467K->997K (1536K) ，0.0181775 secs]1920K- 记 997K (21 


0.0195257 secs] 
0.312: [GC 0.312: 
[Tenuredq:1544K- 之 160 
0.0197396 secs] 
0..590% LEC 05905 
[Tenuredq:2675K- 之 221 
0.0263501 secs] 
0.958: [GC 0.958: 





0.0431992 





secs] 


[De 


[De 





[De 


fNew:576K->64K (576K) ， 
9K (2684K) ，0.0256020 secs] 


[DefNew:551K->>64K (576K) ， 
[Tenured: 3979K->>3470K (4084K) ，0.0419335 secs ] 


fNew:574K->>33K (576K) ，0.0012562 secs] 





fNew:575K->64K (576K) ，0.0004974 secs] 
8K (1664K) ，0.0191592 secs] 





0.0006360 secs] 





0.0011433 secs ] 





0.279 : 
L12K) ， 


Us312: 


1980K- 二 1608K (2240K)， 


05S5905 





3090K- 二 2219K (3260K)， 





0 


4222K- 二 3470K〈4660K) ， 


1.575: [Eull GC 1.575: [Tenured:4800K->5046K (5784K) ，0.0543136 


secs]5189K- 这 >5046K (6360K) ， 


secs] 


.7037[8C ls703: De 
[Tenured:8441K->>8505K (8540K) ，0.0607638 secs]8691K->8505K (9244K) ， 


0.0621470 


secs] 


1 80377[GC L8375 De 
[Tenured:14616K->14680K (14688K) ， 0.0708748 secs]15035K-> 





[Perm:12287K- 二 12287K (12288K) ]， 











0.0544163 


fNew:703K->63K (704K) ，0.0012609 secs]1.705: 


fNew:1151K->64K (1152K) ，0.0020698 secs]1.839: 


14680K (15840K) ，0.0730947 secs ] 
2.144:[GC 2.144: [DefNew:1856K->191K (1856K) ，0.0026810 
secs]2.147: [Tenured:25092K->24656K (25108K) ，0.1112429 secs]26172K-> 
24656K (26964K) ，0.1141099 secs] 
2.337:[GC 2.337: [DefNew:1914K->0K (3136K) ，0.0009697 secs]2.338: 
[Tenured:41779K->>27347K (42056K) ，0.0954341 secs]42733K-> 
27347K (45192K) ， 0.0965513 secs] 
2.465: [GC 2.465: [DefNew:2490K->0K (3456K) ，0.0011044 secs]2.466: 
[Tenured:46379K->>27635K (46828K) ，0.0956937 secs]47621K-> 
27635K (50284K) ，0.0969918 secs] 























括号 中 加 粗 的 数字 代表 老年 代 的 容量 ， 这 组 GC 日 志 显 示 了 10 次 Full 
GC 发 生 的 原因 全 部 都 是 老年 代 空间 耗 尽 ， 每 发 生 一 次 Full GC 都 伴随 着 
一 次 老年 代 空间 扩容 : 1536KB->>1664KB-> 之 2684KB......42056KB->> 
46828KB，10 次 GC 以 后 老年 代 容 量 从 起 始 的 1536KB 扩 大 到 46828KB， 
当 15 秒 后 Eclipse 局 动 完 成 时 ， 老 年 代 容 量 扩大 到 了 103428KB， 代 码 编 
译 开 始 后 ， 老 年 代 容量 到 达 顶 峰 473MB， 整 个 Java 堆 到 达 最 大 容量 


D12MB。 








日 志 还 显示 有 些 时 候 内 存 回收 状况 很 不 理想 ， 空 间 扩 容 成 为 获取 可 
用 内 存 的 最 主要 手段 ， 璧 如 语句 "Tenured:25092K-> 
24656K 〈25108K) ，0.1112429 secs"， 代 表 老 年 代 当 前 容量 关 
25108KB， 内 存 使 用 到 25092KB 的 时 候 发 生 Ful GC， 花 费 0.11 秒 把 内 存 
使 用 降低 到 24656KB， 只 回收 了 不 到 500KB 的 内 存 ， 这 次 GC 基 本 没有 什 
么 回收 效果 ， 仅 仅 做 了 扩容 ， 扩 容 过 程 相 比 起 回收 过 程 可 以 看 做 是 基本 
不 需要 花费 时 间 的 ， 所 以 说 这 0.11 秒 几乎 是 白白 浪费 了 。 








由 上 述 分 析 可 以 得 出 结论 :Eclipse 启动 时 ，Full GC 大 多 数 是 由 于 老 





年 代 容 量 扩展 而 导致 的 ， 由 永久 代 空 间 扩展 而 导致 的 也 有 一 部 分 。 为 了 
避免 这 些 扩展 所 带 来 的 性 能 浪费 ， 我 们 可 以 把 -Xms 和 -XX:PermSize 参 数 
值 设置 为 -Xmx 和 -XX:MaxPermSize 参 数值 一 样 ， 这 样 就 强制 虚拟 机 在 启 
动 的 时 候 就 把 老年 代 和 永久 代 的 容量 固定 下 来 ， 避 免 运行 时 目 动 扩 
展 上 ]。 





根据 分 析 ， 优 化 计划 确定 为 : 把 新 生 代 容 量 提 升 到 128MB， 避 免 新 
生 代 频繁 GC; 把 Java 堆 、 永 久 代 的 容量 分 别 固定 为 512MB 和 96MB14， 
避 倪 内 存 扩 展 。 这 几 个 数值 都 是 根据 机 器 硬件、Eclipse 插 件 和 工程 数量 
来 决定 的 ， 读 者 实践 的 时 候 应 根据 VisualGC 中 收集 到 的 实际 数据 进行 设 
置 。 改 动 后 的 eclipse.ini 配 置 如 代码 清单 5-10 所 示 。 


代码 清单 5-10 ”内 存 调 整 后 的 Eclipse 配置 文件 





—vm 

D:/ DevSpace/jdk1.6.0 21/bin/javaw.exe 

-Startup 
plugins/org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
--launcher.library 
plugins/org.eclipse.equinox.launcher.win32.win32.x86 1.0.200.v2009 


























-product 
org.eclipse.epp.package.Jjee.product 
-showsplash 

org.eclipse.platform 

-vmargs 


-Dosgi .requiredJavaVersion=1.5 
-Xverify:none 

-Xmx512m 

-Xms512m 

-Xmn128m 

-XX:PermSize=96m 
-XX:MaxPermSize=96m 








i 


现在 这 个 配置 之 下 ，GC 次 数 已 经 大 幅度 降低 ， 图 5-9 是 Eclipse 局 动 
后 1 分 钟 的 监视 曲线 ， 只 发 生 了 8 次 Minor GC 和 4 次 Full GC， 总 耗 时 为 
1.928 秒 。 


Spaces Graphs 
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Surviver 0 (12.750N, 12. 750N) : 0 





-Survivor 1 (〔(12-750R， 12. 7508): 0 


roOld Gen (384. 000W, 384.0008W): 66.370N, 4 collections, 1. 401s 


rn Gen (96.000N, 96.000N): 35. 288H 














图 5-9 GC 调整 后 的 运行 数据 





这 个 结果 已 经 算是 基本 正常 ， 但 是 还 存在 一 点 瑕 竟 : 从 Old Gen 的 
曲线 上 看 ， 老 年 代 直 接 固定 在 384MB， 而 内 存 使 用 量 只 有 66MB， 并 且 
一 直 很 平滑 ， 完 全 不 应 该 发 生 Full GC 才 对 ， 那 4 次 Full GC 是 怎么 来 的 ? 
使 用 jstat-gccause 查 询 一 下 最 近 一 次 GC 的 原因 ， 见 代码 清单 5-11。 





代码 清单 5-11 查询 GC 原因 








C:\Users\IcyFenix>jps 

9772 Jps 

4068 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
C:\Users\IcyFenix~>jstat-gccause 4068 

SU S1 EO P YGC YGCT FGC FGCT GCT LGCC GCC 

0.00 0.00 1.00 14.81 39.29 6 0.422 20 5.992 6.414 
System.gc()No GC 











从 LGCC (Last GC Cause) 中 看 到 ， 原 来 是 代码 调用 System.gc() 显 
式 触发 的 GC， 在 内 存 设置 调整 后 ， 这 种 显 式 GC 已 不 符合 我 们 的 期 望 ， 
因此 在 eclipse.ini 中 加 入 参数 -XX:+DisableExplicitGC 屏 菩 掉 System.gc()。 
再 次 测试 发 现 启 动 期 间 的 Full GC 已 经 完全 没有 了 ， 只 有 6 次 Minor GC， 
耗 时 417 室 秒 ， 与 调 优 前 4.149 秒 的 测试 样本 相 比 ， 正 好 是 十 分 之 一 。 进 
行 GC 调 优 后 Eclipse 的 启动 时 间 下 降 非 常 明 显 ， 比 整个 GC 时 间 降 低 的 绝 
对 值 还 大 ， 现 在 启动 只 需要 7 秒 多 ， 如 图 5-10 所 示 。 


全 Information 


0@ Eclipse 启动 耗 时 ; 73T9ms 





图 5-10 Eclipse 启动 时 间 
四 严格 来 说 ， 不 包括 正在 执行 native 代 码 的 用 户 线程 ， 因 为 native 代 码 一 
般 不 会 改变 Java 对 象 的 引用 关系 ， 所 以 没有 必要 挂 起 它们 来 等 待 垃圾 回 
收 。 
加 可 以 通过 以 下 几 个 参数 要 求 庶 拟 机 生成 GC 上 日志: - 


XX:+PrintGCTimeStamps (打印 GC 停顿 时 间 ) 、- 

XX:+PrintGCDetails (打印 GC 详细 信息 ) 、-vetbose:gc (打印 GC 信息 ， 

输出 内 容 已 被 前 一 个 参数 包括 ， 可 以 不 写 ) 、-Xloggc:gc.log。 

[3] 需 要 说 明 一 点 ， 虚 拟 机 启动 的 时 候 就 会 把 参数 中 所 设 定 的 内 存 全 部 划 

为 私有 ， 即 使 扩容 前 有 一 部 分 内 存 不 会 被 用 户 代码 用 到 ， 这 部 分 内 存 也 

不 会 交 给 其 他 进程 使 用 。 这 部 分 内 存在 虚拟 机 中 被 标识 为 "Virtual" 内 

存 。 

[512MB 和 96MB 两 个 数值 对 于 笔者 的 应 用 情况 来 说 依然 偏 少 ， 但 由 于 
需要 同时 开启 VMWare 工 作 ， 所 以 需要 预 留 较 多 内 存 ， 读 者 在 实际 

调 优 时 不 妨 再 设置 大 一 些 。 


5.3.5 ”选择 收集 右 降 低 延 迟 


现在 Edlipse 局 动 已 经 比较 迅速 了 ， 但 我 们 的 调 优 实战 还 没有 结束 ， 

毕竟 Eclipse 是 拿 来 写 程 序 的 ， 不 是 拿 来 测试 启动 速度 的 。 我 们 不 妨 再 在 
Eclipse 中 测试 一 个 非常 常用 但 又 比较 耗 时 的 操作 : 代码 编译 。 图 5-11 是 
当前 配置 下 Eclipse 进行 代码 编译 时 的 运行 数据 ， 从 图 中 可 以 看 出 ， 新 生 
代 每 次 回收 耗 时 约 65 毫 秒 ， 老 年 代 每 次 回收 耗 时 约 725 毫 秒 。 对 于 用 户 
来 说 ， 新 生 代 GC 的 耗 时 还 好 ，65 毫 秒 在 使 用 中 无 法 察觉 到 ， 而 老年 代 
每 次 GC 停顿 接近 1 秒 钟 ， 虽 然 比较 长 时 间 才 会 出 现 一 次 ， 但 停顿 还 是 显 
得 太 长 了 一 些 。 
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图 5-11 编译 期 间 运 行 数据 


再 注意 看 一 下 编译 期 间 的 CPU 资源 使 用 状况 。 图 5-12 是 Eclipse 在 编 
译 期 间 的 CPU 使 用 率 曲线 图 ， 整 个 编译 过 程 中 平均 只 使 用 了 不 到 30% 的 
CPU 资源 ， 垃 圾 收集 的 CPU 使 用 率 曲 线 更 是 几乎 与 坐标 横 轴 紧 贴 在 一 
起 ， 这 说 明 CPU 资 源 还 有 很 多 可 利用 的 余地 。 





CPU 


CPU 人 和 使 用 哺 况 : 5. 3% 垃圾 回收 活动 : 0. 0% 


国 CPY 使 用 情况 图 垃圾 回收 活动 





图 5-12 编译 期 间 CPU 曲 线 





列举 GC 停 顿时 间 、CPU 资 源 富余 的 目的 ， 都 是 为 了 接 下 来 蔡 换 卸 
Client 模 式 的 虚拟 机 中 默认 的 新 生 代 、 老 年 代 串 行 收 集 右 做 铺垫 。 


Eclipse 应 当 算 是 与 使 用 者 交互 非常 频繁 的 应 用 程序 ， 由 于 代码 太 
多 ， 笔 者 习惯 在 做 全 量 编译 或 者 清理 动作 的 时 候 ， 使 用 "Run in 
Backgroup" 功 能 一 边 编译 一 边 继续 工作 。 回 顾 一 下 在 第 3 章 提 到 的 几 种 
收集 器 ， 很 容易 想到 CMS 是 最 符合 这 类 场景 的 收集 器 。 因 此 党 试 在 
eclipse.ini 中 再 加 入 这 两 个 参数 -XX:+UseConcMarkSweepGC、- 
XX:+UseParNewGC (ParNew 收 集 器 是 使 用 CMS 收 集 器 后 的 默认 新 生 代 
收集 器 ， 写 上 仅 是 为 了 配置 更 加 清晰 ) ， 要 求 虚拟 机 在 新 生 代 和 老年 代 
分 别 使 用 ParNew 和 CMS 收集 器 进行 垃圾 回收 。 指 定 收集 器 之 后 ， 再 次 
测试 的 结果 如 图 5-13 所 示 ， 与 原来 使 用 串 行 收集 器 对 比 ， 新 生 代 停顿 从 
每 次 65 毫 秒 下 降 到 了 每 次 53 训 秒 ， 而 老年 代 的 停顿 时 间 更 是 从 725 毫 秒 
大 幅 下 降 到 了 36 毫 秒 。 
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Dld Gen (384.000N, 384. 000N): 224.5208, 6 collections，221.337ms 


ce 


Surviveor 1 (12.7500, 12.750M): 0 





图 5-13 指定 ParNew 和 CMS 收集 器 后 的 GC 数 据 


当然 ，CMS 的 停顿 阶段 只 是 收集 过 程 中 的 一 小 部 分 ， 并 不 是 真 的 把 
垃圾 收集 时 间 从 725 训 秒 变 成 36 毫 秒 了 。 在 GC 日 志 中 可 以 看 到 CMS 与 程 
序 并 发 的 时 间 约 为 400 宫 秒 ， 这 样 收集 器 的 运作 结果 就 比较 令 人 满意 
了 


到 此 ， 对 于 虚拟 机 内 存 的 调 优 基本 就 结束 了 ， 这 次 实战 可 以 看 做 是 
一 次 简化 的 服务 端 调 优 过 程 ， 因 为 服务 端 调 优 有 可 能 还 会 存在 于 更 多 方 
面 ， 如 数据 库 、 资 源 池 、 磁 盘 IO 等 ， 但 对 于 虚拟 机 内 存 部 分 的 优化 ， 
与 这 次 实战 中 的 思路 没有 什么 太 大 差别 。 即 使 读者 实际 工作 中 接触 不 到 
服务 器 ， 根 据 自 己 工作 环境 做 一 些 试验 ， 总 结 几 个 参数 让 自己 日 常 工作 

速度 有 较 大 幅度 提升 也 是 很 划算 的 。 最 终 eclipse.ini 的 配置 如 代码 清 
单 5-12 所 示 。 




















代码 清单 5-12 ”修改 收集 器 配置 后 的 Eclipse 配 置 





—vm 
D:/ DevSpace/jdk1.6.0 21/bin/javaw.exe 

-startup 
plugins/org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
--launcher.library 
plugins/org.eclipse.equinox.launcher.win32.win32.x86 1.0.200.v2009 























-product 
org.eclipse.epp.package.Jjee.product 
-showsplash 

org.eclipse.platform 

-vmargs 


-Dcom.sun.management .jmxremote 
-Dosgi .requiredJavaVersion=1.5 





-Xverify:none 

-Xmx512m 

-Xms512m 

-Xmn128m 

-XX: PermSize=96m 
-XX:MaxPermSize=96m 
-XX:+DisableExplicitGC 
-Xnoclassgc 
-XX:+UseParNewGC 
-XX:+UseConcMarkSweepGC 
-XX:CMSInitiatingOccupancyFraction=85 














| 


5.4 本 章 小 结 


Java 虚 拟 机 的 内 存 管理 与 垃圾 收集 是 虚拟 机 结构 体系 中 最 重要 的 组 
成 部 分 ， 对 程序 的 性 能 和 稳定 性 有 非常 大 的 影响 ， 在 本 书 的 第 2~5 章 
中 ， 笔 者 从 理论 知识 、 异 常 现象 、 代 码 、 工 具 、 和 案例 、 实 战 等 几 个 方面 
对 其 进行 了 讲解 ， 硕 望 读 者 有 所 收获 。 











本 书 关 于 虚拟 机 内 存 管理 部 分 到 此 为 止 就 结束 了 ， 后 面 将 开始 介绍 
Class 文 件 与 虚拟 机 执行 子 系统 方面 的 知识 。 


第 三 部 分 “虚拟 机 执行 子 系统 





类 文件 结构 


虚拟 机 类 加 载 机 制 


虚拟 机 字 市 码 执行 引擎 


类 加 载 及 执行 子 系统 的 案例 与 实战 


第 6 章 ”类 文件 结构 


代码 编译 的 结果 从 本 地 机 器 人 码 转变 为 字 节 人 码 ， 是 存储 格式 发 展 的 一 
小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


6.1 概述 





记得 在 第 一 节 计 算 机 程序 读 上 我 的 老师 就 讲 过 :“ 计 算 机 只 认识 0 和 
1， 所 以 我 们 写 的 程序 需要 经 纺 译 器 翻译 成 由 0 和 1 构成 的 二 进 制 格式 才 
能 由 计算 机 执行 ?>。10 多 年 时 间 过 去 了 ,今天 的 计算 机 仍然 只 能 识别 0 和 
1， 但 由 于 最 近 10 年 内 虚拟 机 以 及 大 量 建立 在 虚拟 机 之 上 的 程序 语言 如 
雨后春笋 般 出 现 并 固有 劲 有 发 展 ， 将 我 们 编写 的 程序 编译 成 二 进 制 本 地 机 器 
码 (Native Code) 已 不 再 是 唯一 的 选择 ， 越 来 越 多 的 程序 语言 选择 了 与 
操作 系统 和 机 器 指令 集 无 关 的 、 平 台中 立 的 格式 作为 程序 编译 后 的 存储 
格式 。 














6.2 ”无 天 性 的 基石 


如 果 计 算 机 的 CPU 指令 集 只 有 x86 一 种 ， 操 作 系统 也 只 有 Windows 
一 种 ， 那 也 许 Java 语 言 就 不 会 出 现 。Java 在 刚刚 诞生 之 时 曾经 提出 过 一 
个 非常 著名 的 宣传 口号 :“ 一 次 编写 ， 到 处 运行 (Write Once,Run 
Anywhere) ”这 人 名 话 充分 表达 了 软件 开发 人 员 对 冲破 平台 界限 的 淘 
求 。 在 无 时 无 刻 不 充满 竞争 的 IT 领域 ， 不 可 能 只 有 Wintel 存 在 ， 我 们 
也 不 希望 只 有 Wintel 存 在 ， 各 种 不 同 的 硬件 体系 结构 和 不 同 的 操作 系统 
肯定 会 长 期 并 存 发 展 。“ 与 平台 无 关 ” 的 理想 最 终 实现 在 操作 系统 的 应 用 
层 上 : Sun 公 司 以 及 其 他 虚拟 机 提供 商 发 布 了 许多 可 以 运行 在 各 种 不 同 
平台 上 的 虚拟 机 ， 这 些 虚拟 机 都 可 以 载 入 和 执行 同一 种 平台 无 关 的 字 节 
码 ， 从 而 实现 了 程序 的 “一 次 编写 ， 到 处 运行 ”。 























各 种 不 同 平台 的 虚拟 机 与 所 有 平台 都 统一 使 用 的 程序 存储 格式 一 一 
字 节 人 码 (ByteCode) 是 构成 平台 无 关 性 的 基石 ， 但 本 节 标 题 中 刻意 省 略 
了 “平台 ”二 字 ， 那 是 因为 笔者 注意 到 虚拟 机 的 另外 一 种 中 立 特 性 一 一 语 
言 无 关 性 正 越 来 越 被 开发 者 所 重视 。 到 目前 为 止 ， 或 许 大 部 分 程序 员 都 
还 认为 Java 虚 拟 机 执行 Java 程 序 是 一 件 理所当然 和 天 经 地 义 的 事情 。 但 
在 Java 发 展 之 初 ， 设 计 者 就 曾经 考虑 过 并 实现 了 让 其 他 语言 运行 在 Java 
虚拟 机 之 上 的 可 能 性 ， 他 们 在 发 布 规范 文档 的 时 候 ， 也 刻意 把 Java 的 规 
范 拆 分 成 了 Java 语 言 规范 《The Java Language Specification》 及 Java 虚 拟 











机 规范 《The Java Virtual Machine Specification》。 并 且 在 1997 年 发 布 的 
第 一 版 Java 虚 拟 机 规范 中 就 曾经 承诺 过 : "In the future,we will consider 
bounded extensions to the Java virtual machine to provide better support for 
other languages"〈 在 未 来 ， 我 们 会 对 Java 虚 拟 机 进行 适当 的 扩展 ， 以 便 
更 好 地 支持 其 他 语言 运行 于 JVM 之 上 ) ， 当 Java 虚 拟 机 发 展 到 JDK 
1.7~1.8 的 时 候 ，JVM 设 计 者 通过 JSR-292 基 本 部 现 了 这 个 承诺 。 


时 至 今日 ， 商 业 机 构 和 开源 机 构 已 经 在 Java 语 言 之 外 发 展 出 一 大 批 
在 Java 虚 拟 机 之 上 运行 的 语言 ， 如 Clojure、Groovy、JRuby、Jython、 
Scala 等 。 使 用 过 这 些 语言 的 开发 者 可 能 还 不 是 非常 多 ， 但 是 听 说 过 的 人 
肯定 已 经 不 少 ， 随 着 时 间 的 推移 ， 谁 能 保证 日 后 Java 虚 拟 机 在 语言 无 关 
性 上 的 优势 不 会 赶 上 甚至 超越 它 在 平台 无 关 性 上 的 优势 呢 ? 





实现 语言 无 关 性 的 基础 仍然 是 虚拟 机 和 字 节 人 码 存 储 格式 。Java 虚 拟 
机 不 和 包括 Java 在 内 的 任何 语言 绑 定 ， 它 只 与 “Class 文 件 ” 这 种 特定 的 二 
进 制 文件 格式 所 关联 ，Class 文 件 中 包含 了 Java 虚 拟 机 指令 集 和 符号 表 以 
及 右 干 其 他 辅助 信息 。 基 于 安全 方面 的 考虑 ，Java 虚 拟 机 规范 要 求 在 
Class 文 件 中 使 用 许多 强制 性 的 语法 和 结构 化 约束 ， 但 任 一 门 功能 性 语言 
都 可 以 表示 为 一 个 能 被 Java 虚 拟 机 所 接受 的 有 效 的 Class 文 件 。 作 为 一 个 
通用 的 、 机 器 无 关 的 执行 平台 ， 任 何其 他 语言 的 实现 者 都 可 以 将 Java 虚 
拟 机 作为 语言 的 产品 交付 媒介 。 例 如 ， 使 用 Java 纺 译 器 可 以 把 Java 代 码 
编译 为 存储 字 市 码 的 Class 文 件 ， 使 用 JRuby 等 其 他 语言 的 编译 右 一 样 可 


























以 把 程序 代码 编译 成 Class 文 件 ， 虚 拟 机 并 不 关心 Class 的 来 源 是 何 种 语 
言 ， 如 图 6-1 所 示 。 


java 磺 拟 机 








图 6-1 Java 虚拟 机 提供 的 语言 无 关 性 


Java 语 言 中 的 各 种 变量 、 关 键 字 和 运算 符号 的 语义 最 终 都 是 由 多 条 
字 贡 码 命令 组 合 而 成 的 ， 因 此 字 节 码 命令 所 能 提供 的 语义 描述 能 力 肯 定 
会 比 Java 语 言 本 身 更 加 强大 。 因 此 ， 有 一 些 Java 语 言 本 身 无 法 有 效 文 持 
的 语言 特性 不 代表 字 节 码 本 身 无 法 有 效 文 持 ， 这 也 为 其 他 语言 实现 一 些 
有 别 于 Java 的 语言 特性 提供 了 基础 。 


[1]Wintel: 微软 公司 的 Windows 与 Intel 公 司 的 芯片 相 结 合 ， 曾 经 是 业界 最 
强大 的 联盟 。 


6.3 Class 类 文件 的 结构 








解析 Class 文 件 的 数据 结构 是 本 章 的 最 主要 内 容 。 笔 者 曾经 在 前 言 中 








的 重要 基础 之 一 。 如 果 想 比较 深入 地 了 解 虚拟 机 ， 那 么 这 部 分 是 不 能 不 
接触 的 。 


在 本 章 关 于 Class 文 件 结构 的 讲解 中 ， 我 们 将 以 《Java 虚 拟 机 规范 
(第 2 版 》 (1999 年 发 布 ， 对 应 于 JDK 1.4 时 代 的 Java 虚 拟 机 ) 中 的 定 
义 为 主线 ， 这 部 分 内 容 虽 然 古 老 ， 但 它 所 包含 的 指令 、 属 性 是 Class 文 件 
中 最 重要 和 最 基础 的 。 同 时 ， 我 们 也 会 以 后 续 JDK 1.5~JDK 1.7 中 添加 
的 内 容 为 支线 进行 较为 简略 的 、 介 绍 性 的 讲解 ， 如 果 读 者 对 这 部 分 内 容 
特别 感 兴 趣 ， 建 议 参考 笔者 所 翻译 的 《Java 虚 拟 机 规范 〈JavaSE7) 》 
中 文 版 ， 可 以 在 笔者 的 网 站 (http:Wicyfenix.iteye.com/) 上 下 载 到 这 本 书 
的 全 文 PDF。 


注意 ”任何 一 个 Class 文 件 都 对 应 着 唯一 一 个 类 或 接口 的 定义 信息 ， 


但 反 过 来 说 ， 类 或 接口 并 不 一 定 都 得 定义 在 文件 里 《譬如 类 或 接口 也 可 
以 通过 类 加 载 融 直接 生成 ) 。 本 章 中 ， 笔 者 只 是 通俗 地 将 任意 一 个 有 效 

















的 类 或 接口 所 应 当 满 足 的 格式 称 为 "Class 文件 格式 ”， 实 际 上 和 它 并 不 一 定 
以 磁盘 文件 的 形式 存在 。 


Class 文 件 是 一 组 以 8 位 字 节 为 基础 单位 的 二 进 制 流 ， 各 个 数据 项 目 
严格 按照 顺序 紧凑 地 排列 在 Class 文 件 之 中 ， 中 间 没 有 添加 任何 分 隔 符 ， 
这 使 得 整个 Class 文 件 中 存储 的 内 容 几 乎 全 部 是 程序 运行 的 必要 数据 ， 没 
有 空隙 存在 。 当 过 到 需要 占用 8 位 字 节 以 上 空间 的 数据 项 时 ， 则 会 按照 
高 位 在 前 路 的 方式 分 割 成 若干 个 8 位 字 节 进行 存储 。 














根据 Java 虚 拟 机 规范 的 规定 ，Class 文 件 格 式 采用 一 种 类 似 于 C 语 言 
结构 体 的 伪 结 构 来 存储 数据 ， 这 种 伪 结 构 中 只 有 两 种 数据 类 型 : 无 符号 
数 和 表 ， 后 面 的 解析 都 要 以 这 两 种 数据 类 型 为 基础 ， 所 以 这 里 要 先 介 绍 


这 两 个 概念 。 





无 符号 数 属 于 基本 的 数据 类 型 ， 以 ul、u2、u4、u8 来 分 别 代 表 1 个 
字 节 、2 个 字 节 、4 个 字 节 和 8 个 字 节 的 无 符号 数 ， 无 符号 数 可 以 用 来 描 


述 数字 、 索 引 引用 、 数 量 值 或 者 按照 UTF-8 编 码 构成 字符 串 值 。 











表 是 由 多 个 无 符号 数 或 者 其 他 表 作 为 数据 项 构成 的 复合 数据 类 型 ， 
所 有 表 都 习惯 性 地 以 "_info" 结 尾 。 表 用 于 描述 有 层次 关系 的 复合 结构 的 
数据 ， 整 个 Class 文 件 本 质 上 就 是 一 张 表 ， 它 由 表 6-1 所 示 的 数据 项 构 
成 。 


表 6-1 Class 文件 格式 


一 


























类 型 名 称 数 量 
u4 magic 1 
u2 minor_ Version 1 
u2 major_version 1 
u2 constant pool count 1 
cp_info constant pool constant pool _ count-1 
u2 access flags ] 
十 
u2 this_class 1 
u2 super class 1 
-一 
u2 interfaces count 1 
u2 interfaces interfaces count 
u2 fields count 1 
field_info fields fields count 
u2 methods count 1 
method_info methods methods count 
u2 attributes_count 1 
attribute_info attributes attributes_count 

















无 论 是 无 符号 数 还 是 表 ， 当 需要 描述 同一 类 型 但 数量 不 定 的 多 个 数 
据 时 ， 经 常会 使 用 一 个 前 置 的 容量 计数 占 加 奢 干 个 连续 的 数据 项 的 形 
式 ， 这 时 称 这 一 系列 连续 的 菜 一 类 型 的 数据 为 某 一 类 型 的 集合 。 








本 节 结 束 之 前 ， 笔 者 需要 再 重复 讲 一 下 ，Class 的 结构 不 像 XML 等 
描述 语言 ， 由 于 它 没 有 任何 分 隅 符号 ， 所 以 在 表 6-1 中 的 数据 项 ， 无 论 
征 顺 序 还 是 数量 ， 甚 至 于 数据 存储 的 字 节 序 (Byte Ordering,Class 文 件 中 
字 节 序 为 Big-Endian) 这 样 的 细节 ， 都 是 被 严格 限定 的 ， 哪 个 字 贡 代表 
什么 含义 ， 长 度 是 多 少 ， 先 后 顺序 如 何 ， 痢 不 允许 改变 。 接 下 来 我 们 将 
一 起 看 看 这 个 表 中 各 个 数据 项 的 具体 含义 。 




















6.3.1 ” 磨 数 与 Class 文 件 的 版 本 





每 个 Class 文 件 的 头 4 个 字 节 称 为 魔 数 (Magic Number) ， 它 的 唯一 
作用 是 确定 这 个 文件 是 否 为 一 个 能 被 虚拟 机 接受 的 Class 文 件 。 很 多 文件 
存储 标准 中 都 使 用 魔 数 来 进行 身份 识别 ， 壁 如 图 片 格式 ， 如 gif 或 者 jpeg 
等 在 文件 头 中 都 存 有 魔 数 。 使 用 魔 数 而 不 是 扩展 名 来 进行 识别 主要 是 基 
于 安全 方面 的 考虑 ， 因 为 文件 扩展 名 可 以 随意 地 改动 。 文 件 格式 的 制定 
者 可 以 自由 地 选择 魔 数值 ， 只 要 这 个 魔 数值 还 没有 被 广泛 采用 过 同时 又 
不 会 引起 混 消 即 可 。Class 文 件 的 魔 数 的 获得 很 有 “ 当 漫 气 县 "， 值 为 : 
0xCAFEBABE《〈 咖 啡 宝贝 ? ) ， 这 个 魔 数值 在 Java 还 称 做 "Oak" 语 言 的 
时 候 《〈 大 约 是 1991 年 前 后 ) 就 已 经 确定 下 来 了 。 它 还 有 一 段 很 有 趣 的 历 
史 ， 据 Java 开 发 小 组 最 初 的 关键 成 员 Patrick Naughton 所 说 : “我 们 一 直 
在 寻找 一 些 好 玩 的 、 容 易 记 忆 的 东西 ， 选 择 0xCAFEBABE 是 因为 它 象 
征 着 著名 咖啡 品牌 Peet's Coffee 中 深 受 欢迎 的 Baristas 咖 啡 ”， 这 个 魔 数 似 
乎 也 预示 着 日 后 "Java" 这 个 商标 名 称 的 出 现 。 









































紧 接 着 魔 数 的 4 个 字 节 存储 的 是 Class 文 件 的 版 本 号 : 第 5 和 第 6 个 字 
和 是 次 版 本 号 (Minor Version ) ， 第 7 和 第 8 个 字 节 是 主 版 本 号 (Major 
Version) 。Java 的 版 本 号 是 从 45 开 始 的 ，JDK 1.1 之 后 的 每 个 JDK 大 版 本 
发 布 主 版 本 号 向 上 加 1 (JDK 1.0~1.1 使 用 了 45.0~45.3 的 版 本 号 ) ， 高 版 
本 的 JDK 能 向 下 兼容 以 前 版 本 的 Class 文 件 ， 但 不 能 运行 以 后 版 本 的 Class 
文件 ， 即 使 文件 格式 并 未 发 生 任何 变化 ， 虚 拟 机 也 必须 拒绝 执行 超过 其 
版 本 号 的 Class 文 件 。 























例如 ，JDK 1.1 能 支持 版 本 号 为 45.0~45.65535 的 Class 文 件 ， 无 法 执 
行 版 本 号 为 46.0 以 上 的 Class 文 件 ， 而 JDK 1.2 则 能 支持 45.0~46.65535 的 
Class 文 件 。 现 在 ， 最 新 的 JDK 版 本 为 1.7， 可 生成 的 Class 文 件 主 版 本 号 
最 大 值 为 51.0。 





为 了 讲解 方便 ， 笔 者 准备 了 一 段 最 简单 的 Java 代 码 〈 见 代码 清单 6- 
1) ， 本 章 后 面 的 内 容 都 将 以 这 段 小 程序 使 用 JDK 1.6 编 译 输出 的 Class 文 
件 为 基础 来 进行 讲解 。 


代码 清单 6-1 简单 的 Java 代 码 








package org.fenixsoft.clazz; 
public class TestClassit 
private jint m; 

public int inc(){ 

return m+1; 

} 

} 














图 6-2 显 示 的 是 使 用 十 六 进 制 编辑 器 WinHex 打 开 这 个 Class 文 件 的 结 
果 ， 可 以 清楚 地 看 见 开 头 4 个 字 节 的 十 六 进 制 表示 是 0xCAFEBABE， 代 
表 次 版 本 号 的 第 5 个 和 第 6 个 字 节 值 为 0x0000， 而 主 版 本 号 的 值 为 
0x0032， 也 即 是 十 进 制 的 50， 该 版 本 号 说 明 这 个 文件 是 可 以 被 JDK 1.6 
或 以 上 版 本 虚拟 机 执行 的 Class 文 件 。 











Of fset 
00000000 
00000010 
00000020 
00000030 


I 
CA FE BA BE 00 00 00 
6F 72 67 2F 66 65 6E 
61 7A 7A 2F 54 65 73 
01 00 10 6A 61 ?6 61 


.WL 


纪 00 16 07 00 02 01 


orgq/Fenixsoft/cl1 
azz/TestClass,,. 
.java/lang/0b 





图 6-2 Java Class 文件 的 结构 


表 6-2 列 出 了 从 JDK 1.1 到 JDK 1.7， 主 流 JDK 版 本 编译 器 输出 的 默认 


和 可 支持 的 Class 文 件 版 本 号 。 






































表 6-2 Class 文件 版 本 号 
编译 器 版 本 -target 参数 十 六 进 制版 本 号 十 进 制版 本 号 
JDK 1.1.8 不 能 带 target 参数 45.3 
JDK 1.2.2 不 带 〈 默 认为 -target 1.1) 45.3 
JDK 1.2.2 -target 1.2 46.0 
JDK 1.3.1_19 不 带 〈 默 认为 -target 1.1) 00 03 00 2D 45.3 
JDK 1.3.1 19 -target 1.3 00 00 00 2F 47.0 
JDK 1.4.2 10 不 带 《〈 默 认为 -target 1.2) 00 00 00 2E 46.0 
JDK 1.4.2_10 -target 1.4 00 00 00 30 48.0 
JDK 1.5.0 11 不 带 《〈 默 认为 -target 1.5) 00 00 00 31 49.0 
JDK 1.5.0_11 -target 1.4 -source 1.4 00 00 00 30 48.0 
JDK 1.6.0 01 不 带 〈 默 认为 -target 1.6) 50.0 
JDK 1.6.0 01 -target 1.5 49.0 
JDK 1.6.0 01 -target 1.4 -source 1.4 00 00 00 30 48.0 
JDK 1.7.0 不 带 《 睦 认为 -target 1.7) 00 00 00 33 51.0 
JDK 1.7.0 -target 1.6 00 00 00 32 50.0 
JDK 1.7.0 -target 1.4 -source 1.4 00 00 00 30 48.0 





四 这 种 顺序 称 为 "Big-Endian"， 具 体 是 指 最 高 位 字 节 在 地 址 最 低位 、 最 
低位 字 节 在 地 址 最 高 位 的 顺序 来 存储 数据 ， 它 是 SPARC、PowerPC 等 处 
理 器 的 默认 多 字 节 存储 顺序 ， 而 x86 等 处 理 器 则 是 使 用 了 相反 的 "Little- 


Endian" 顺 序 来 存储 数据 。 


6.3.2 ”常量 池 








紧 接着 主 次 版 本 写 之 后 的 是 常量 池 入 口 ， 和 常量 池 可 以 理解 为 Class 文 
件 之 中 的 资源 仓库 ， 它 是 Class 文 件 结构 中 与 其 他 项 目 关 联 最 多 的 数据 类 
型 ， 也 是 占用 Class 文 件 空间 最 大 的 数据 项 目 之 一 ， 同 时 它 还 是 在 Class 
文件 中 第 一 个 出 现 的 表 类 型 数据 项 目 。 








由 于 常量 池 中 常量 的 数量 是 不 固定 的 ， 所 以 在 常量 池 的 入 口 需要 放 
置 一 项 02 类 型 的 数据 ， 代 表 常 量 池 容量 计数 值 
《constant_pool_count〉。 与 Java 中 语言 习惯 不 一 样 的 是 ， 这 个 容量 计数 
是 从 1 而 不 是 0 开始 的 ， 如 图 6-3 所 示 ， 常 量 池 容 量 ( 偏 移 地 址 : 
0x00000008) 为 十 六 进 制 数 0x0016， 即 十 进 制 的 22， 这 就 代表 常量 池 中 
有 21 项 常量 ， 索 引 值 范围 为 1~21。 在 Class 文 件 格式 规范 制定 之 时 ， 设 
计 者 将 第 0 项 常量 空 出 来 是 有 特殊 考虑 的 ， 这 样 做 的 目的 在 于 满足 后 面 
某 些 指向 常量 池 的 索引 值 的 数据 在 特定 情况 下 需要 表达 “不 引用 任何 一 
个 常量 池 项 目 ”的 含义 ， 这 种 情况 就 可 以 把 索引 值 置 为 0 来 表示 。Class 文 
件 结构 中 只 有 常量 池 的 容量 计数 是 从 1 开始 ， 对 于 其 他 集合 类 型 ， 包 括 
接口 索引 集合 、 字 段 表 集合 、 方 法 表 集 合 等 的 容量 计数 都 与 一 般 习 惯 相 
同 ， 是 从 0 开始 的 。 
































上 法. 和 上 
CA FE BA BE 00 32 00 起 07 00 02 01 00 2 
00000010 |6F 72 67 2F 66 6 ze 73 GE 66 74:2F .63 org/fenixsoft/cl 


00000020 161 7A 7&a 2F 54 65 7: 43 hbC pl 73 73 0n07 00 04 azz/TestClass... 
1 00 10 6A 61 76 61 2 6| 歼 拓 好 释 全 6 .. .java/lang/Obj 





图 6-3 常量 池 结 构 








常量 池 中 主要 存放 两 大 类 常量 : 字面 量 (Literal〉 和 符号 引用 
(Symbolic References) 。 字 面 量 比较 接近 于 Java 语 言 层面 的 常量 概 
念 ， 如 文本 字符 串 、 声 明 为 final 的 常量 值 等 。 而 符号 引用 则 属于 编译 原 
理 方面 的 概念 ， 包 括 了 下 面 三 类 常量 : 














类 和 接口 的 全 限定 名 (Fully Qualified Name) 
字段 的 名 称 和 描述 符 (Descriptor) 
方法 的 名 称 和 描述 符 


Java 代 码 在 进行 Javac 编 译 的 时 候 ， 并 不 像 C 和 C++ 那样 有 “连接 ”这 
一 步 又， 而 是 在 虚拟 机 加 载 Class 文 件 的 时 候 进 行动 态 连 接 。 也 就 是 说 ， 
在 Class 文 件 中 不 会 保存 各 个 方法 、 字 段 的 最 终 内 存 布局 信息 ， 因 此 这 些 
字段 、 方 法 的 符号 引用 不 经 过 运行 期 转换 的 话 无 法 得 到 真正 的 内 存 入 口 
地 址 ， 也 融 无 法 直接 被 虚拟 机 使 用 。 当 虚拟 机 运行 时 ， 需 要 从 御 量 池 获 
得 对 应 的 符号 引用 ， 再 在 类 创建 时 或 运行 时 和 解析、 翻译 到 具体 的 内 存 地 
址 之 中 。 关 于 类 的 创建 和 动态 连接 的 内 容 ， 在 下 一 章 介 绍 虚 拟 机 类 加 载 











过 程 时 再 进行 详细 讲解 。 





常量 池 中 每 一 项 常量 都 是 一 个 表 ， 在 JDK 1.7 之 前 共有 11 种 结构 各 
不 相同 的 表 结 构 数 据 ， 在 JDK 1.7 中 为 了 更 好 地 支持 动态 语言 调用 ， 又 
额外 增加 了 3 种 (CONSTANT_MethodHandle_info、 





CONSTANT_MethodType_info 和 CONSTANT_InvokeDynamic_info， 本 
章 不 会 涉及 这 3 种 新 增 的 类 型 ， 在 第 8 章 介 绍 字 节 人 码 执 行 和 方法 调用 时 ， 


将 会 详细 讲解 ) 。 


这 14 种 表 部 有 一 个 共同 的 特点 ， 束 是 表 开 始 的 第 一 位 是 一 个 ul 类 型 
的 标志 位 (tag， 取 值 见 表 6-3 中 标志 列 ) ， 代 表 当 前 这 个 常量 属于 哪 种 
常量 类 型 。 这 14 种 种 量 类 型 所 代表 的 具体 含义 见 表 6-3。 





表 6-3 常量 池 的 项 目 类 型 


新 


CONSTANT Utf8_info 
CONSTANT Integer_info 





CONSTANT Float info 


UTF-8 编码 的 字符 串 


整 型 字面 量 





浮 点 型 字面 基 





CONSTANT Long info 
CONSTANT Double info 
CONSTANT Class_info 


长 整 型 字面 量 
双 精 度 浮 点 型 字面 量 
类 或 接口 的 符号 引用 





CONSTANT _ String_info 


字符 串 类 型 字面 量 





CONSTANT Fieldref info 
CONSTANT Methodref info 
CONSTANT InterfaceMethodref info 


bt | pt CO 90 | 证 | 路 | Lo 
Le 


字段 的 符号 引用 
类 中 方法 的 符号 引用 
接口 中 方法 的 符号 引用 














CONSTANT NameAndType info 12 字段 或 方法 的 部 分 符号 引用 
CONSTANT MethodHandle info 15 表示 方法 句柄 

CONSTANT MethodType_info 16 标识 方法 类 型 

CONSTANT _InvokeDynamic_info 18 表示 一 个 动态 方法 调用 点 





之 所 以 说 常量 池 是 最 烦琐 的 数据 ， 和 是 因为 这 14 种 和 量 类 型 各 上 自 均 有 





自己 的 结构 。 回 头 看 看 图 6-3 中 常量 池 的 第 一 项 常量 ， 它 的 标志 位 〈 偶 
移 地 址 : 0x0000000A) 是 0x07， 查 表 6-3 的 标志 列 发 现 这 个 常量 属于 


太 夺 口 


CONSTANT_Class_info 类 型 ， 此 类 型 的 常量 代表 一 个 类 或 者 接口 的 符号 





引用 。CONSTANT Class_info 的 结构 比较 简单 ， 见 表 6-4。 


表 6-4 CONSTANT_Class_info 型 常量 的 结构 
称 


tag 


name index 


tag 是 标志 人 位， 上面 已 经 讲 过 了 ， 它 用 于 区 分 常量 类 型 ，name_index 











是 一 个 索引 值 ， 它 指向 常量 池 中 一 个 CONSTANT_Utf8_info 类 型 常量 ， 





此 常量 代表 了 这 个 类 (或 者 接口 ) 的 全 限定 名 ， 这 里 name _index 信 ( 偏 
移 地 址 : 0x0000000B ) 为 0x0002， 也 即 是 指向 了 常量 池 中 的 第 二 项 常 








量 。 继 续 从 图 6-3 中 查找 第 二 项 常量 ， 它 的 标志 位 (地 址 : 
0x0000000D) 是 0x01， 查 表 6-3 可 知 确实 是 一 个 CONSTANT_Utf8_info 


类 型 的 常量 。CONSTANT Utf8 info 类 型 的 结构 见 表 6-5。 


表 6-5 CONSTANT_Utf8_info 型 常量 的 结构 








2 length 





bytes 








length 值 说 明了 这 个 UTF-8 编 码 的 字符 串 长 度 是 多 少 字 市 ， 它 后 面 
紧 跟 独 的 长 度 为 length 字 的 连续 数据 是 一 个 使 用 UTF-8 缩 略 编码 表示 


的 字符 串 。UTF-8 缩 略 编码 与 普通 UTF-8 编 码 的 区 别 是 : 

从 Nu0001' 到 Nu007f' 之 间 的 字符 《相当 于 1~127 的 ASCIH 码 ) 的 缩 略 编码 
使 用 一 个 字 节 表示 ， 从 Nu0080' 到 "u07ff 之 间 的 所 有 字符 的 缩 略 编码 用 两 
个 字 节 表示 ， 从 Nu0800' 到 "uffff' 之 则 的 所 有 字符 的 缩 略 编码 就 按照 普通 
UTF-8 编 码 规则 使 用 三 个 字 节 表示 。 





顺便 提 一 下 ， 由 于 Class 文 件 中 方法 、 字 段 等 都 需要 引用 
CONSTANT_Utf8_info 型 常量 来 描述 名 称 ， 所 以 CONSTANT_Utf8_info 
型 常量 的 最 大 长 度 也 就 是 Java 中 方法 、 字 段 名 的 最 大 长 度 。 而 这 里 的 最 
大 长 度 就 是 length 的 最 大 值 ， 既 u2 类 型 能 表达 的 最 大 值 65535。 所 以 Java 
程序 中 如 果 定义 了 超过 64KB 英 文字 符 的 变量 或 方法 名 ， 将 会 无 法 编 


译 。 














本 例 中 这 个 字符 串 的 langth 值 〈 偏 移 地 址 : 0x0000000E) 为 
0x001D， 也 就 是 长 29 字 节 ， 往 后 29 字 节 正 好 都 在 1~127 的 ASCII 码 范围 
以 内 ， 内 容 为 "org/fenixsoft/clazz/TestClass"， 有 兴趣 的 读者 可 以 自己 逐 
个 字 节 换算 一 下 ， 换 算 结 果 如 图 6-4 选 中 的 部 分 所 示 。 





Lt 和 日 
CA FE BA BE 00 00 00 32 00 16 07 00 02 01 
6F 72 67 2F 66 65 bE 69 78 73 6F 66 74 2F 63 6C org/fenixsoft/cl 


BL 7A 7A 2F 04 65 73 74 43 60 61 737 上 07 00 04 到 2ZTsstCcl5s 目 . ， ， 
0000003 01 00 10 ba 6l 76 61 2F 6C 6b1 6E 67 2F 4F 62 A ., .java-langohbj 





图 6-4 常量 池 UTF-8 字 符 串 结构 


到 此 为 止 ， 我 们 分 析 了 TestClass.class 常 量 池 中 21 个 常量 中 的 两 个 ， 
其 余 的 19 个 常量 都 可 以 通过 类 似 的 方法 计算 出 来 。 为 了 避免 计算 过 程 占 
用 过 多 的 版 面 ， 后 续 的 19 个 常量 的 计算 过 程 可 以 借助 计算 机 来 帮 有 我 们 完 
成 。 在 JDK 的 bin 目 录 中 ，Oracle 公 司 已 经 为 我 们 准备 好 一 个 专门 用 于 分 
析 Class 文 件 字 贡 码 的 工具 : javap， 代 码 清单 6-2 中 列 出 了 使 用 javap 工 具 
的 -verbose 参 数 输 出 的 TestClass.class 文 件 字 节 码 内 容 ( 此 清单 中 省 略 了 
常量 池 以 外 的 信息 ) 。 前 面 我 们 曾经 提 到 过 ，Class 文 件 中 还 有 很 多 数据 
项 都 要 引用 常量 池 中 的 常量 ， 所 以 代码 清单 6-2 中 的 内 容 在 后 续 的 讲解 
过 程 中 还 要 经 常 使 用 到 。 








代码 清单 6-2 ”使 用 Javap 命 令 输出 常量 表 





C:\>javap-verbose TestClass 

Compiled from"TestClass.java" 

public class org.fenixsoft.clazz.TestClass extends 
java.lang.Object 

SourcerFile:"TestClass.java" 

minor version:0 

major version:50 

Constant pool: 

const#1=class#2; //org/fenixsoft/clazz/TestClass 

const#2=Asciz org/fenixsoft/clazz/TestClass:; 

const#3=class#4; //java/lang/Object 

const#4=Asciz java/lang/Object; 

Const#5=Asciz mi 

Const#6=Asciz I; 

Const#7=Asciz<init 之 ; 

const#8=Asciz()YV; 

const#9=Asciz Code:; 

const#10=Method#3.#11; //java/lang/Object."<init>": ()V 

const#11=NameAndType#7:#8; //"<init>": ()V 

Const#12=Asciz LineNumberTable:; 

const#13=Asciz LocalVariableTable:; 

const#14=Asciz this; 




































































const#15=Asciz Lorg/fenixsoft/clazz/TestClass; 
const#16=Asciz inc; 

const#17=Asciz ()I:; 
const#18=Field#1.#19; //org/fenixsoft/clazz/TestClass.m:I 
const#19=NameAndType#5:#6; //m:I 
Const#20=Asciz SourcerFile; 
const#21=Asciz TestClass.jJava:; 









































从 代码 清单 6-2 中 可 以 看 出 ， 计 算 机 已 经 帮 我 们 把 整个 常量 池 的 21 
项 常量 都 计算 了 出 来 ， 并 且 第 1、2 项 常量 的 计算 结果 与 我 们 手工 计算 的 
结果 一 致 。 仔 细 看 一 下 会 发 现 ， 其 中 有 一 些 常 量 似 乎 从 来 没有 在 代码 中 
出 现 过 ， 如 "I"、"V"、"<<init 
>"、"LineNumberTable"、"LocalVariableTable" 等 ， 这 些 看 起 来 在 代码 
任何 一 处 都 没有 出 现 过 的 常量 是 哪里 来 的 呢 ? 


这 部 分 自动 生成 的 常量 的 确 没 有 在 Java 代 码 里 面 直接 出 现 过 ， 但 它 
们 会 被 后 面 即将 讲 到 的 字段 表 〈field_info) 、 方 法 表 (method info) 、 
属性 表 (attribute_info〉 引 用 到 ， 它 们 会 用 来 描述 一 些 不 方便 使 用 “固定 
字 节 ”进行 表达 的 内 容 。 壁 如 描述 方法 的 返回 值 是 什么 ?有 几 个 参数 ? 
每 个 参数 的 类 型 是 什么 ”因为 Java 中 的 “类 ”是 无 穷 无 尽 的 ， 无 法 通过 简 
单 的 无 符号 字 节 来 描述 一 个 方法 用 到 了 什么 类 ， 因 此 在 描述 方法 的 这 些 
需要 引用 常量 表 中 的 符号 引用 进行 表达 。 这 部 分 内 容 将 在 后 面 
进一步 阐述 。 最 后 ， 笔 者 将 这 14 种 常量 项 的 结构 定义 总 结 为 表 6-6 以 供 








表 6-6 常量 池 中 的 14 种 常量 项 的 结构 总 表 


NW 而 
汪汪 -请 症 区 

CONSTANT_Uttg_info UTF-8 编码 的 字符 串 占 用 的 字 节 数 
7 ET 

CONSTANT Integer | mg | wu | 值 为 3 

nt | 
mm 

CONSTANT Float info 
Ei 

CONSTANT Long info 本 
[as 

nt TT 
证 

CONSTANT_Class_info 人 
ET 
IE 本 

CONSTANT String info ee 
ET 
i 


CONSTANT Fieldref 


info 


指向 声明 字段 的 类 或 者 接口 描述 符 
index u2 二 
CONSTANT_Class_info 的 索引 项 

指向 字段 描述 符 CONSTANT NameAndType 


RS 

E 于 
index u2 E i 
| 的 索引 项 


| gm 
指向 声明 方法 的 类 描述 符 CONSTANT _ 
index u2 EE | 3 
Class_info 的 索引 项 
指向 名 称 及 类 型 描述 符 CONSTANT_ 
index u2 
NameAndType 的 索引 项 
CONSTANT Interface- 5 指向 声明 方法 的 接口 描述 符 CONSTANT _ 
Methodref info Class_info 的 索引 项 


指 问 名 称 及 类 型 描述 符 CONSTANT_ 


u2 > 


CONSTANT_Methodref 
info 


常 量 描 述 
值 为 12 
指向 该 字段 或 方法 名 称 常量 项 的 索引 
指向 该 字段 或 方法 描述 符 常量 项 的 索引 
值 为 15 
值 必须 在 1 一 9 之 间 (包括 1 和 9)， 它 
决定 了 方法 句柄 的 类 型 。 方 法 句柄 类 型 的 值 
表示 方法 句柄 的 字 节 码 行为 
值 必须 是 对 常量 池 的 有 效 索引 
[人 
CONSTANT_Method- 值 必 须 是 对 常量 池 的 有 效 索 引 ， 常 量 池 在 
Type_info descriptor_index u2 该 索引 处 的 项 必须 是 CONSTANT _Utf8_info 
结构 ， 表 示 方 法 的 描述 符 


| | 


bootstrap_method attr_ 值 必 须 是 对 当前 Class 文件 中 引导 方法 表 
index “ 的 bootstrap_methods[] 数组 的 有 效 索 引 
CONSTANT Invoke- 


必须 是 ; YIz 常服 1 - 央 索引 ， 
Dynamic_info 值 必 须 是 对 当前 常 量 池 的 有 效 索 引 

量 池 在 该 索引 处 的 项 必须 是 CONSTANT _ 
NameAndType info 结构 ， 表 示 方 法 名 和 方 


CONSTANT Name- 
AndType_info 


CONSTANT Method- 
Handle_info 








name and type_index u2 





6.3.3 访问 标志 





在 常量 池 结 束 之 后 ， 紧 接着 的 两 个 字 厄 代表 访问 标志 
Caccess_flags) ， 这 个 标志 用 于 识别 一 些 类 或 者 接口 层次 的 访问 信息 ， 
包括 : 这 个 Class 是 类 还 是 接口 ; I 是 否定 义 为 
abstract 类 型 ， 如果 是 类 的 话 ， 是 否 被 声明 为 final 等 。 有 具体 的 标志 位 以 及 
标志 的 含义 见 表 6-7。 





表 6-7 访问 标志 








标志 名 称 标 志 值 含 义 
ACC_PUBLIC 0x0001 是 否 为 public 类 型 
ACC FINAL 0x0010 志和 否 被 声明 为 fnal， 只 有 类 可 设置 
是 否 人 允许 使 用 invokespecial 字 节 码 指令 的 新 语意 ，invokespecial 
ACC_SUPER 0x0020 指令 的 语意 在 JDK 1.0.2 发 生 过 改变 ， 为 了 区 别 这 条 指令 使 用 哪 种 
语意 ，JDK 1.0.2 之 后 编译 出 来 的 类 的 这 个 标志 都 必须 为 真 
ACC INTERFACE 0x0200 标识 这 是 一 个 接口 


是 否 为 abstract 类 型 ， 对 于 接口 或 者 抽象 类 来 说 ， 此 标志 值 为 











ACC ABSTRACT 0x0400 直 ， 其 他 类 值 为 假 
ACC SYNTHETIC 0x1000 标识 这 个 类 并 非 由 用 户 代 码 产 生 的 
ACC ANNOTATION 0x2000 标识 这 是 一 个 注解 
ACC ENUM 0x4000 标识 这 是 一 个 枚 举 


access_flags 中 一 共有 16 个 标志 位 可 以 使 用 ， 当 前 只 定义 了 其 中 8 个 
由， 没有 使 用 到 的 标志 位 要 求 一 律 为 0。 以 代码 清单 6-1 中 的 代码 为 例 ， 
TestClass 是 一 个 普通 Java 类 ， 不 是 接口 、 枚 举 或 者 注解 ， 被 public 关 键 字 
修饰 但 没有 被 声明 为 final 和 abstract， 并 且 它 使 用 了 JDK 1.2 之 后 的 编译 
器 进行 编译 ， 因 此 它 的 ACC_PUBLIC、ACC_SUPER 标 志 应 当 为 真 ， 而 





ACC_FINAL、 ACC INTERFACE、 ACC_ABSTRACT. 
ACC_SYNTHETIC、ACC_ANNOTATION、ACC_ENUM 这 6 个 标志 应 
当 为 假 ， 因 此 它 的 access_flags 的 值 应 为 : 0x0001|0x0020=0x0021。 从 图 
6-5 中 可 以 看 出 ，access_flags 标 志 〔( 偏 移 地 址 : 0x000000EF) 的 确 为 
Ox0021。 


000000D0 |06 01 00 0A S53 6F 75 63 65 46 69 6C 6 | SourceFfile:. 
000000FE0 |0OE 54 65 73 74 43 6C 6 6 -IestClass. java. 


000000F0 1 00 01 00 03 00 00 
00 00 02 00 01 00 07 





图 6-5 ”access_flags 标 志 
[1 在 Java 虚 拟 机 规范 中 ， 只 定义 了 开头 5 种 标志 。JDK 1.5 中 增加 了 后 面 3 
种 。 这 些 标 志 为 在 JSR-202 规 范 中 声明 ， 是 对 《Java 虚 拟 机 规范 (第 2 
版 ) 》 的 补充 。 本 书 介绍 的 访问 标志 以 JSR-202 规 范 为 准 。 





6.34， 闫 穴 引 多 类 有 蛇 引 与 接口 索引 集合 


类 索引 〈this_class) 和 父 类 索引 (super_class) 都 是 一 个 u2 类 型 的 
数据 ， 而 接口 索引 集合 (interfaces) 是 一 组 u2 类 型 的 数据 的 集合 ，Class 
文件 中 由 这 三 项 数据 来 确定 这 个 类 的 继承 关系 。 类 索引 用 于 确定 这 个 类 
的 全 限定 名 ， 父 类 索引 用 于 确定 这 个 类 的 父 类 的 全 限定 名 。 由 于 Java 语 
言 不 允许 多 重 继承 ， 所 以 父 类 索引 只 有 一 个 ， 除 了 java.lang.Object 之 
外 ， 所 有 的 Java 类 都 有 父 类 ， 因 此 除了 java.lang.Object 外 ， 所 有 Java 类 的 

父 类 索引 都 不 为 0。 接 口 索引 集合 就 用 来 描述 这 个 类 实现 了 哪些 接口 ， 
这 些 被 实现 的 接口 将 按 implements 语 句 〈 如 果 这 个 类 本 身 是 一 个 接口 ， 
则 应 当 是 extends 语 句 ) 后 的 接口 顺序 从 左 到 右 排列 在 接口 索引 集合 中 。 























类 索引 、 父 类 索引 和 接口 索引 集合 都 按 顺 序 排 列 在 访问 标志 之 后 ， 
类 索引 和 父 类 索引 用 两 个 u2 类 型 的 索引 值 表示 ， 它 们 各 自 指向 一 个 类 型 
为 CONSTANT_Class_info 的 类 描述 符 常 量 ， 通 过 
CONSTANT_Class_info 类 型 的 常量 中 的 索引 值 可 以 找到 定义 在 
CONSTANT_Utf8_info 类 型 的 常量 中 的 全 限定 名 字符 串 。 图 6-6 演 示 了 代 
码 清单 6-1 的 代码 的 类 索引 查找 过 程 。 











对 于 接口 索引 集合 ， 入 口 的 第 一 类 型 的 数据 为 接口 计数 器 
(interfaces_count) ， 表 示 索 引 表 的 容量 。 如 果 该 类 没有 实现 任何 接 

















口 ， 则 该 计数 露 值 为 0， 后 面 接口 的 索引 表 不 再 占用 任何 字 节 。 代 码 清 
单 6-1 中 的 代码 的 类 索引 、 父 类 索引 与 接口 表 索 引 的 内 容 如 图 6-7 所 示 。 


1 CORSTANT Class_info #2 CONSTANT Utf8 info 


index:2 length:29 


bytas' org/fenixsoft/clarz 
/TostClass 


Do00D000D0 |06 D01 00 OA 53 6F 75 72 65 01 00 .SourceFile.- 
D00D00EgE0 | 0OE 54 65 73 74 43 6C 61 76 61 00| .TestClass, java. 
D00000F0 |21 00°030003 00 0 回 00 00 05 00 
00000100 ,00 00 02 00 01 00 07 00 00 00 00 





图 6-7 类 索引 、 父 类 索引 、 接 口 索引 集合 


从 偏 移 地 址 0x000000F1 开 始 的 3 个 u2 类 型 的 值 分 别 为 0x0001、 
0x0003、0x0000， 也 就 是 类 索引 为 1， 父 类 索引 为 3， 接 口 索引 集合 大 小 
为 0， 查 询 前 面 代码 清单 6-2 中 javap 命 令 计算 出 来 的 常量 池 ， 找 出 对 应 的 
类 和 父 类 的 和 常量， 结果 如 代码 清单 6-3 所 示 。 





代码 清单 6-3 ”部 分 常量 池内 容 





const#1=class#2; //org/fenixsoft/clazz/TestClass 
const#2=Asciz org/fenixsoft/clazz/TestClass; 
const#3=class#4; //java/lang/Object 
const#4=Asciz java/lang/Object; 


























6.3.5 “字段 表 集 合 





字段 表 (field_info〉 用 于 描述 接口 或 者 类 中 声明 的 变量 。 字 上段 

(field) 包括 类 级 变量 以 及 实例 级 变量 ， 但 不 包括 在 方法 内 部 声明 的 局 
部 变量 。 我 们 可 以 想 一 想 在 Java 中 描述 一 个 字段 可 以 包含 什么 信息 ?可 
以 包括 的 信息 有 : 字段 的 作用 域 (public、private、Pprotected 修 饰 符 ) 、 
是 实例 变量 还 是 类 变量 〈static 修 饰 符 ) 、 可 变性 〈final) 、 并 发 可 见 性 
(volatile 修 饰 符 ， 是 否 强制 从 主 内 存 读 写 ) 、 可 否 被 序列 化 〈transient 
修饰 符 ) 、 字 有 段 数据 类 型 (基本 类 型 、 对 象 、 数 组 ) 、 字 段 名 称 。 上 述 
这 些 信息 中 ， 各 个 修饰 符 都 是 布尔 值 ， 要 么 有 某 个 修饰 符 ， 要 么 没有 ， 
很 适合 使 用 标志 位 来 表示 。 而 字段 叫 什么 名 字 、 字 段 被 定义 为 什么 数据 
类 型 ， 这 些 都 是 无 法 固定 的 ， 只 能 引用 常量 池 中 的 常量 来 描述 。 表 6-8 
中 列 出 了 字段 表 的 最 终 格 式 。 




































| access flags attributes count | 1 










| name index attributes | attributes count 





descriptor index 





字段 修饰 符 放 在 access_flags 项 目 中 ， 它 与 类 中 的 access_flags 项 目 是 
非常 类 似 的 ， 都 是 一 个 u2 的 数据 类 型 ， 其 中 可 以 设置 的 标志 位 和 含义 见 
表 6-9。 


表 6-9 字段 访问 标志 

















标志 名 称 标志 值 含 义 
ACC PUBLIC 0x0001 字段 是 否 public 
ACC PRIVATE 0x0002 字段 是 否 private 
ACC PROTECTED 0x0004 字段 是 否 protected 
ACC STATIC Ox0008 字段 是 否 static 
ACC FINAL 0x0010 字段 是 否 final 
ACC VOLATILE 0x0040 字段 是 否 volatile 
ACC TRANSIENT 0x0080 字段 是 否 transient 
ACC SYNTHETIC 0x1000 字段 是 否 由 编译 需 自 动产 生 的 
ACC ENUM 0x4000 字段 是 否 enum 











很 明显 ， 在 实际 情况 中 ，ACC PUBLIC、ACC PRIVATE、 





ACC_PROTECTED 三 个 标志 最 多 只 能 选择 其 一 ，ACC_FINAL、 
ACC_VOLATILE 不 能 同时 选择 。 接 口 之 中 的 字段 必须 有 
ACC_PUBLIC、ACC_STATIC、ACC_FINAL 标 志 ， 这 些 都 是 由 Java 本 
身 的 语言 规则 所 决定 的 。 


跟随 access_flags 标 志 的 是 两 项 索引 值 : name_index 和 
descriptor_index。 它 们 都 是 对 常量 池 的 引用 ， 分 别 代表 着 字段 的 简单 名 
称 以 及 字段 和 方法 的 描述 符 。 现 在 需要 解释 一 下 “简单 名 称 ”、“ 摘 述 
符 ” 以 及 前 面 出 现 过 多 次 的 “全 限定 名 ”这 三 种 特殊 字符 串 的 概念 。 





全 限定 名 和 简单 名 称 很 好 理解 ， 以 代码 清单 6-1 中 的 代码 为 
例 ，"org/fenixsoftclazz/TestClass" 是 这 个 类 的 全 限定 名 ， 仅 仅 是 把 类 全 
名 中 的 “.” 蔡 换 成 了 “而 已 ， 为 了 使 连续 的 多 个 全 限定 名 之 间 不 产生 混 
消 ， 在 使 用 时 最 后 一 般 会 加 入 一 个 “; ”表示 全 限定 名 结束 。 简 单 名 称 是 
指 没有 类 型 和 参数 修饰 的 方法 或 者 字段 名 称 ， 这 个 类 中 的 inc0 方 法 和 m 





字段 的 简单 名 称 分 别 是 "inc" 和 "m"。 


相对 于 全 限定 名 和 简单 名 称 来 说 ， 方 法 和 字段 的 描述 符 就 要 复杂 一 
些 。 描 述 符 的 作用 是 用 来 描述 字段 的 数据 类 型 、 方 法 的 参数 列表 (包括 
数量 、 类 型 以 及 顺序 ) 和 返回 值 。 根 据 描述 符 规则 ， 基 本 数据 类 型 
(byte、char、double、float、int、long、short、boolean)〉 以 及 代表 无 返 
回 值 的 void 类 型 都 用 一 个 大 写字 符 来 表示 ， 而 对 象 类 型 则 用 字符 L 加 对 
象 的 全 限定 名 来 表示 ， 详 见 表 6-10。 





表 6-10 ”描述 符 标识 字符 含义 




















标识 字符 标识 字符 含 义 

B 车 本 类 型 byte J 其 本 类 型 long 

C 寺 本 类 型 char S 基本 类 型 short 

D 法 本 类 型 double 过 慧 本 类 型 boolean 

了 起 本 类 型 float V 特殊 类 型 void 

I 法 本 类 型 int 攻 对 象 类 型 ， 如 Ljava/lang/Object 
[1] 


对 于 数组 类 型 ， 每 一 维度 将 使 用 一 个 前 置 的 [字符 来 描述 ， 如 一 
个 定义 为 "java.lang.String[][]" 类 型 的 二 维 数 组 ， 将 被 记录 为 : " 
[[Ljava/lang/String; "， 一 个 整 型 数组 "int[]" 将 被 记录 为 "[I"。 


用 描述 符 来 描述 方法 时 ， 按 照 先 参数 列表 ， 后 返回 值 的 顺序 描述 
参数 列表 按照 参数 的 严格 顺序 放 在 一 组 小 括号 “()”* 之 内 。 如 方法 void 
incO 的 描述 符 为 "0V"， 方 法 java.lang.String toString() 的 描述 符 为 " 


OLjava/lang/String; "， 方 法 int indexOf (char[]source,int sourceOffset,int 


sourceCount,char[ ltarget,int targetOffset,int targetCount,int fromIndex ) 的 


描述 符 为 "([CII[CIII) I"。 


对 于 代码 清单 6-1 中 的 TestClass.class 文 件 来 说 ， 字 段 表 集合 从 地 址 
0x000000F8 开 始 ， 第 一 个 u2 类 型 的 数据 为 容量 计数 器 fields_count， 如 图 
6-8 所 示 ， 其 值 为 0x0001， 说 明 这 个 类 只 有 一 个 字段 表 数 据 。 接 下 来 紧 
跟着 容量 计数 器 的 是 access_flags 标 志 ， 值 为 0x0002， 代 表 private 修 饰 符 
的 ACC_PRIVATE 标 志 位 为 真 (ACC_PRIVATE 标 志 的 值 为 0x0002) ， 
其 他 修饰 符 为 假 。 代 表 字 上段 名 称 的 name_index 的 值 为 0x0005， 从 代码 清 
单 6-2 列 出 的 常量 表 中 可 但 得 第 5 项 常量 是 一 个 CONSTANT_Utf8_info 类 
型 的 字符 串 ， 其 值 为 "m"， 代 表 字 段 描述 符 的 descriptor_index 的 值 为 
0x0006， 指 向 常量 池 的 字符 串 "I"， 根 据 这 些 信息 ， 我 们 可 以 推断 出 原 代 
人 码 定 义 的 字段 为 : "private int m; " 








字段 表 都 包含 的 固定 数据 项 目 到 descriptor_index 为 止 就 结束 了 ， 不 
过 在 descriptor_index 之 后 跟随 着 一 个 属性 表 集 合用 于 存储 一 些 额外 的 信 
息 ， 字 有 段 都 可 以 在 属性 表 中 描述 零 至 多 项 的 额外 信息 。 对 于 本 例 中 的 字 
段 m， 它 的 属性 表 计 数 器 为 0， 也 就 是 没有 需要 额外 描述 的 信息 ， 但 
是 ， 如 果 将 字段 m 的 声明 改 为 "final static int m=123;"， 那 就 可 能 会 存在 
一 项 名 称 为 ConstantValue 的 属性 ， 其 值 指向 常量 123。 关 于 attribute_info 
的 其 他 内 容 ， 将 在 6.3.7 节 介绍 属性 表 的 数据 项 目 时 再 进一步 讲解 。 





000000D0 |06 01 00 0A 53 6F 75 72 63 65 46 69 6C 65 01 00 |...,.SourceFile.,. 
000000E0 |0E 54 65 73 74 43 6C 61 73 73 2E 6A 61 76 61 00 | .TestClass.java. 


000000F0 |21 00 01 00 03 00 00 ooliloo oz3loo 05lloosog oo ) 





fields 


name_indew 


00000100 |00 00 02 00 01 O00 07 00 08 3 00403 EF 00 
count 





图 6-8 字段 表 结构 实例 


字段 表 集合 中 不 会 列 出 从 超 类 或 者 父 接口 中 继承 而 来 的 字段 ， 但 有 
可 能 列 出 原本 Java 代 码 之 中 不 存在 的 字段 ， 辟 如 在 内 部 类 中 为 了 保持 对 
外 部 类 的 访问 性 ， 会 自动 添加 指 癌 外 部 类 实例 的 字段 。 男 外 ， 在 Java 语 
言 中 字段 是 无 法 重 载 的 ， 两 个 字段 的 数据 类 型 、 修 饰 符 不 管 是 否 相 同 ， 
都 必须 使 用 不 一 样 的 名 称 ， 但 是 对 于 字 市 码 来 讲 ， 如 有 果 两 个 字段 的 描述 
符 不 一 致 ， 那 字段 重 名 就 是 合法 的 。 




















[void 类 型 在 虚拟 机 规范 之 中 单独 列 出 为 "VoidDesctiptot"， 笔 者 为 了 结 
构 统 一 ， 将 其 列 在 基本 数据 类 型 中 一 起 描述 。 





6.3.6 “方法 表 集 合 


如 果 理 解 了 上 一 节 关 于 字段 表 的 内 容 ， 那 本 节 关 于 方法 表 的 内 容 将 
会 变 得 很 简单 。Class 文 件 存储 格式 中 对 方法 的 描述 与 对 字段 的 描述 几乎 
采用 了 完全 一 致 的 方式 ， 方 法 表 的 结构 如 同 字 段 表 一 样 ， 依 次 包括 了 访 
问 标志 〈access_flags) 、 名 称 索引 Cname_index) 、 描 述 符 索引 
Cdescriptor_index) 、 属 性 表 集 合 〈attributes) 几 项 ， 见 表 6-11。 这 些 
数据 项 目的 含义 也 非常 类 似 ， 仅 在 访问 标志 和 属性 表 集 合 的 可 选项 中 有 
所 区 别 。 


表 6-11 方法 表 结 构 

















为 volatile 关 键 字 和 transient 关 键 字 不 能 修饰 方法 ， 所 以 方法 表 的 
访问 标志 中 没有 了 ACC_VOLATILE 标 志和 ACC_TRANSIENT 标 志 。 上 
之 相对 的 ，synchronized、native、strictfp 和 abstract 关 键 字 可 以 修饰 方 
法 ， 所 以 方法 表 的 访问 标志 中 增加 了 ACC_SYNCHRONIZED、 
ACC_NATIVE、ACC_STRICTFP 和 ACC_ABSTRACT 标 志 。 对 于 方法 
表 ， 所 有 标志 位 及 其 取 值 可 参见 表 6-12。 


表 6-12 方法 访问 标志 














标志 名 称 标志 值 含 如 
ACC PUBLIC 0x0001 方法 是 否 为 public 
ACC PRIVATE 0x0002 方法 是 否 为 private 
ACC PROTECTED 0x0004 方法 是 否 为 protected 








ACC_STATIC 0x0008 方法 是 否 为 static 
ACC SYNCHRONIZED 方法 是 否 为 synchronized 
ACC_BRIDGE 方法 是 否 是 由 编译 器 产生 的 桥接 方法 














ACC VARARGS 0x0080 方法 是 否 接受 不 定 参数 
ACC_NATIVE 0x0100 方法 是 否 为 native 

ACC ABSTRACT 0x0400 方法 是 否 为 abstract 

ACC STRICTFP 0x0800 方法 是 否 为 strictfp 
ACC_SYNTHETIC 0x1000 方法 是 否 是 由 编译 器 自动 产生 的 





行文 至 此 ， 也 许 有 的 读者 会 产生 疑问 ， 方 法 的 定义 可 以 通过 访问 标 
志 、 名 称 索 引 、 描 述 符 索引 表达 清楚 ， 但 方法 里 面 的 代码 去 哪里 了 ? 方 
法 里 的 Java 代 码 ， 经 过 编译 器 编译 成 字 节 码 指令 后 ， 存 放 在 方法 属性 表 
集合 中 一 个 名 为 "Code" 的 属性 里 面 ， 属 性 表 作 为 Class 文 件 格式 中 最 有 具 打 - 
展 性 的 一 种 数据 项 目 ， 将 在 6.3.7 节 中 详细 讲解 。 








我 们 继续 以 代码 清单 6-1 中 的 Class 文 件 为 例 对 方法 表 集 合 进行 分 
析 ， 如 图 6-9 所 示 ， 方 法 表 集 合 的 入 口 地 址 为 : 0x00000101， 第 一 个 u2 
类 型 的 数据 〈 即 是 计数 器 容量 ) 的 值 为 0x0002， 代 表 集 合 中 有 两 个 方法 
(这 两 个 方法 为 编译 器 添加 的 实例 构造 器 二 init> 和 源码 中 的 方法 
incO) 。 第 一 个 方法 的 访问 标志 值 为 0x001， 也 就 是 只 有 ACC_PUBLIC 
标志 为 真 ， 名 称 索 引 值 为 0x0007， 查 代码 清单 6-2 的 常量 池 得 方法 名 
为 "<init>"， 描 述 符 索 引 值 为 0x0008， 对 应 常量 为 "0V"， 属 性 表 计 数 














髓 attributes_count 的 值 为 0x0001 束 表示 此 方法 的 属性 表 集 合 有 一 项 属 
性 ， 属 性 名 称 索 引 为 0x0009， 对 应 常量 为 "Code"， 说 明 此 属性 是 方法 的 
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图 6-9 方法 表 结 构 实 例 


与 字段 表 和 集合 相 对 应 的 ， 如 果 父 类 方法 在 子 类 中 没有 人 被 重 写 
COverride) ， 方 法 表 集 合 中 就 不 会 出 现 来 自 父 类 的 方法 信息 。 但 同样 
的 ， 有 可 能 会 出 现 由 编译 右上 自动 添加 的 方法 ， 最 典型 的 便 是 类 构造 


器 "二 clinit 生 "方法 和 实例 构造 器 "二 init 二 " 山 方 法 。 





在 Java 语 言 中 ， 要 重 载 (Overload) 一 个 方法 ， 除 了 要 与 原 方法 具 
有 相同 的 简单 名 称 之 外 ， 还 要 求 必 须 拥有 一 个 与 原 方法 不 同 的 特征 签 
名 上 ， 特 征 签名 就 是 一 个 方法 中 各 个 参数 在 常量 池 中 的 字段 符号 引用 的 
集合 ， 也 残 是 因为 返回 值 不 会 包 合 在 特征 签名 中 ， 因 此 Java 语 言 里 面 是 
无 法 仅仅 依靠 返回 值 的 不 同 来 对 一 个 已 有 方法 进行 重 载 的 。 但 是 在 Class 
文件 格式 中 ， 特 征 签 名 的 范围 更 大 一 些 ， 只 要 描述 符 不 是 完全 一 致 的 两 
个 方法 也 可 以 共存 。 也 就 是 说 ， 如 果 两 个 方法 有 相同 的 名 称 和 特征 签 
名 ， 但 返回 值 不 同 ， 那 么 也 是 可 以 合法 共存 于 同一 个 Class 文 件 中 的 。 











四 <init> 和 <<clinit> 的 详细 内 容 见 本 书 的 第 10 章 。 

[2 在 《Java 虚 拟 机 规范 (第 2 版 )》 的 "S$ 4.4.4 Signatutes" 章 节 及 《Java 语 
言 规范 (第 3 版 )》 的 "§ 8.4.2 Method Signature" 章 节 中 都 分 别 定 义 了 字 
节 码 层面 的 方法 特征 签名 以 及 Java 代 码 层 面 的 方法 特征 签名 ，Java 代 码 
的 方法 特征 签名 只 包括 了 方法 名 称 、 参 数 顺序 及 参数 类 型 ， 而 字 节 码 的 
特征 签名 还 包括 方法 返回 值 以 及 受 查 异常 表 ， 请 读者 根据 上 下 文 语 境 注 


6.3.7 属性 表 和 集合 


属性 表 (attribute_info〉 在 前 面 的 讲解 之 中 已 经 出 现 过 数 次 ， 在 
Class 文 件 、 字 段 表 、 方 法 表 都 可 以 携带 目 己 的 属性 表 人 集合， 以 用 于 摘 述 
某 些 场景 专 有 的 信息 。 








与 Class 文 件 中 其 他 的 数据 项 目 要 求 严格 的 顺序 、 长 度 和 内 容 不 同 ， 
属性 表 集 合 的 限制 稍微 宽松 了 一 些 ， 不 再 要 求 各 个 属性 表 具 有 严格 顺 
序 ， 并 且 只 要 不 与 己 有 属性 名 重复 ， 任 何人 实现 的 编译 器 都 可 以 同属 性 
表 中 写 入 自己 定义 的 属性 信息 ，Java 虚 拟 机 运行 时 会 忽略 掉 它 不 认识 的 
属性 。 为 了 能 正确 解析 Class 文 件 ，《Java 虚 拟 机 规范 (第 2 版 )》 中 预 
定义 了 9 项 虚拟 机 实现 应 当 能 识别 的 属性 ， 而 在 最 新 的 《Java 虚 拟 机 规 
范 (Java SE 7) 》 版 中 ， 预 定义 属性 已 经 增加 到 21 项 ， 具 体内 容 见 表 6- 
13。 下 文中 将 对 其 中 一 些 属性 中 的 关键 第 用 的 部 分 进行 讲解 。 

















表 6-13 虚拟 机 规范 预定 义 的 属性 























属性 名 称 使 用 位 置 含 义 
Code 方法 表 Java 代码 编 详 成 的 字 节 码 指令 
ConstantValue 字段 表 final 关键 字 定 义 的 常量 值 
Deprecated 类 、 方 法 表 、 字 段 表 被 声明 为 deprecated 的 方法 和 字段 
Exceptions 方法 表 方法 抛 出 的 异常 
A 类 文件 仅 当 -个 类 为 局 部 类 或 者 忆 名 类 时 才能 拥有 这 个 属 
性 ， 这 个 属性 用 于 标识 这 个 类 所 在 的 外 围 方 法 





CE 人 
InnerClasses 内 部 类 列表 
LineNumberTable Java 源码 的 行 号 与 字 节 码 指令 的 对 应 关系 
LocalVariableTable 方法 的 局 部 变量 描述 


JDK 1.6 中 新 增 的 属性 ， 供 新 的 类 型 检查 验证 器 
StackMapTable Code 届 性 (Type Checker) 检查 和 处 理 目标 方法 的 局 部 变量 和 操 
作 数 栈 所 需要 的 类 型 是 否 匹配 


JDK 1.5 中 新 增 的 属性 ， 这 个 属性 用 于 支持 泛 型 

ei 答 名 ， 在 Java 语言 中 ， 任何 类 、 Er 
、 初 妈 化 方法 或 成 员 的 汉 型 签名 如 果 包 含 

和 {Type Variables) 或 参数 化 类 型 (Parameterized 
Types)， 则 Signature 属性 会 为 它 记录 泛 型 签名 信息 。 
由 于 Java 的 泛 型 采用 擦 除法 实现 ， 在 为 了 避免 类 型 
信息 被 氛 除 后 导致 签名 混乱 ， 需 要 这 个 属性 记录 泛 型 
中 的 相关 信息 
i 记录 天 文件 名 和 

JDK 1.6 中 新 增 的 属性 ，SourceDebugExtension 属 
性 用 于 存储 额外 的 调试 信息 。 璧 如 在 进行 JSP 文件 调 
试 时 ， 无 法 通过 Java 堆栈 来 定位 到 JSP 文件 的 行 号 ， 
JSR-45 规范 为 这 些 非 Java 语 言 编写 ， 却 需要 编译 成 
字 节 码 并 运行 在 Java 虚拟 机 中 的 程序 提供 了 一 个 进 
行 调 试 的 标准 机 制 ， 使 用 SourceDebugExtension 属性 
就 可 以 用 于 存储 这 个 标准 所 新 加 入 的 调试 信息 
Synthetic 类 、 方 法 表 、 字 段 表 标识 方法 或 字段 为 编译 器 自动 生成 的 

JDK 1.5 中 新 增 的 属性， 它 使 用 特征 签名 代替 描述 
符 ， 是 为 了 引入 泛 型 语法 之 后 能 描述 泛 型 参数 化 类 型 
而 添加 

JDK 1.5 中 新 增 的 属性 ， 为 动态 注解 提供 支持 。 
RuntimeVisibleAnnotations 属性 用 于 指明 哪些 注 
解 是 运行 时 《〈 实 际 上 运行 时 就 是 进行 反射 调用 ) 可 
见 的 

JDK 1.5 中 新 增 的 属性 ， 与 RuntimeVisibleAnnotations 
RuntimeInvisibleAnnotations 类 、 方 法 表 、 字 段 表 属性 作用 刚好 相反 ， 用 于 指明 哪些 注解 是 运行 时 不 可 
见 的 


RuntimeVisibleParameter 方法 家 JDK 15 中 新 增 的 属性 ， 作 用 与 RuntimeVisibleAnnotations 
Annotations 属性 类 似 ， 只 不 过 作用 对 象 为 方法 参数 
RuntimelInvisibleParameter JDK 1.5 中 新 增 的 属性 ， 作 用 与 RuntimelInvisible- 
Annotations Annotations 属性 类 似 ， 只 不 过 作用 对 象 为 方法 参数 
i JDK 1.5 中 新 增 的 局 性 ， 用 寺 记 录 注 解 类 元 素 的 默 
AnnotationDefault 方法 表 Fina 
认 值 
2 JDK 1.7 中 新 增 的 属性 , 用 于 保存 invokedynamic 指 
BootstrapMethods 类 文件 今 引用 的 引导 方法 限定 符 


Signature 类 、 方 法 表 、 字 段 表 





SourceDebugExtension 


LocalVariableType Table 


RuntimeVisibleAnnotations 类 、 方 法 表 、 字 披 表 





对 于 每 个 属性 ， 它 的 名 称 需要 从 常量 池 中 引用 一 个 
CONSTANT _Utf8_info 类 型 的 癌 量 来 表示 ， 而 属性 值 的 结构 则 是 完全 目 
定义 的 ， 只 需要 通过 一 个 u4 的 长 度 属 性 去 说 明 属 性 值 所 占用 的 位 数 即 
可 。 一 个 符合 规则 的 属性 表 应 该 满足 表 6-14 中 所 定义 的 结构 。 








表 6-14 属性 表 结构 








attribute name index 





attribute length 


info 





attribute_length 


1.Code 属 性 





Java 程 序 方法 体 中 的 代码 经 过 Javac 编 译 器 处 理 后 ， 最 终 变 为 字 节 码 
指令 存储 在 Code 属 性 内 。Code 属 性 出 现在 方法 表 的 属性 集合 之 中 ， 但 
并 非 所 有 的 方法 表 都 必须 存在 这 个 属性 ， 辟 如 接口 或 者 抽象 类 中 的 方法 
就 不 存在 Code 属 性 ， 如 果 方 法 表 有 Code 属 性 存在 ， 那 么 它 的 结构 将 如 
表 6-15 所 示 。 


表 6-15 Code 属性 表 的 结构 


























稚 型 名 称 数 量 
u2 attribute name index 1 
u4 attribute_length 1 
u2 max stack 1 
u2 max locals 1 
u4 code length 1 
ul code code length 
u2 exception table length 1 
exception info exception table exception table length 
u2 attributes count 1 
attribute_info attributes attributes_ count 


attribute_name_index 是 一 项 指向 CONSTANT_Utf8_info 型 常量 的 索 
引 ， 常 量 值 固 定 为 "Code"， 它 代表 了 该 属性 的 属性 名 称 ， 
attribute_length 指 示 了 属性 值 的 长 度 ， 由 于 属性 名 称 索 引 与 属性 长 度 一 
共 为 6 字 节 ， 所 以 属性 值 的 长 度 固 定 为 整个 属性 表 长 度 减 去 6 个 字 贡 。 








max_stack 代 表 了 操作 数 栈 (Operand Stacks) 深度 的 最 大 值 。 在 方 
法 执行 的 任意 时 刻 ， 操 作 数 栈 都 不 会 超过 这 个 深度 。 虚 拟 机 运行 的 时 候 
需要 根据 这 个 值 来 分 配 栈 帧 〈Stack Frame) 中 的 操作 栈 深 度 。 








max_locals 代 表 了 局 部 变量 表 所 需 的 存储 空间 。 在 这 里 ，max_locals 
的 单位 是 SlobSlot 是 虚拟 机 为 局 部 变量 分 配 内 存 所 使 用 的 最 小 单位 。 对 
于 byte、char、float、int、short、boolean 和 returnAddress 等 长 度 不 超过 32 
位 的 数据 类 型 ， 每 个 局 部 变量 占用 1 个 Slot， 而 double 和 long 这 两 种 64 位 
的 数据 类 型 则 需要 两 个 Slot 来 存放 。 方 法 参数 〈 包 括 实例 方法 中 的 隐藏 
参数 "this") 、 显 式 异常 处 理 器 的 参数 〈Exception Handler Parameter， 就 














古 try-catch 语 句 中 catch 块 所 定义 的 寞 第 ) 、 方 法 体 中 定义 的 局 部 变量 都 
需要 使 用 局 部 变量 表 来 存放 。 为 外 ， 并 不 是 在 方法 中 用 到 了 多 少 个 局 部 
变量 ， 就 把 这 些 局 部 变量 所 占 Slot 之 和 作为 max_locals 的 值 ， 原 因 是 局 部 
变量 表 中 的 Slot 可 以 重用 ， 当 代码 执行 超出 一 个 局 部 变量 的 作用 域 时 ， 

这 个 局 部 变量 所 占 的 Slot 可 以 被 其 他 局 部 变量 所 使 用 ，Javac 编 译 占 会 根 
所 变量 的 作用 域 来 分 配 Slot 给 各 个 变量 使 用 ， 然 后 计算 出 max_locals 的 大 


小 。 














code_length 和 code 用 来 存储 Java 源 程序 编译 后 生成 的 字 节 人 码 指令 。 

code_length 代 表 字 节 码 长 度 ，code 是 用 于 存储 字 节 码 指令 的 一 系列 字 节 
流 。 既 然 叫 字 节 码 指令 ， 那 么 每 个 指令 就 是 一 个 u1 类 型 的 单字 节 ， 当 虚 
拟 机 读 取 到 code 中 的 一 个 字 节 码 时 ， 就 可 以 对 应 找 出 这 个 字 节 码 代表 的 
是 什么 指令 ， 并 且 可 以 知道 这 条 指令 后 面 是 否 需要 跟随 参数 ， 以 及 参数 
应 当 如 何 理 解 。 我 们 知道 一 个 ul 数据 类 型 的 取 值 范围 为 0x00~0xFF， 对 
应 十 进 制 的 0~*255， 也 就 是 一 共 可 以 表达 256 条 指令 ， 目 前 ，Java 虚 拟 机 
规范 已 经 定义 了 其 中 约 200 条 编码 值 对 应 的 指令 含义 ， 编 码 与 指令 之 间 
的 对 应 关系 可 查阅 本 书 的 附录 B“ 虚 拟 机 字 节 码 指令 表 ”。 




















关于 code_length， 有 一 件 值得 注意 的 事情 ， 虽 然 它 是 一 个 u4 类 型 的 
长 度 值 ， 理 论 上 最 大 值 可 以 达到 232-1， 但 是 虚拟 机 规范 中 明确 限制 了 一 
个 方法 不 允许 超过 65535 条 字 节 码 指令 ， 即 它 实 际 只 使 用 了 u2 的 长 度 ， 
如 果 超 过 这 个 限制 ，Javac 编 译 需 也 会 拒绝 编译 。 一 般 来 讲 ， 编 写 Java 代 











码 时 只 要 不 是 刻意 去 编写 一 个 超 长 的 方法 来 为 难 编译 器 ， 是 不 太 可 能 超 
过 这 个 最 大 值 的 限制 。 但 是 ， 茶 些 特殊 情况 ， 例 如 在 编译 一 个 很 复杂 的 
JSP 文 件 时 ， 某 些 JSP 编 译 器 会 把 JSP 内 容 和 页 面 输出 的 信息 归并 于 一 个 
方法 之 中 ， 残 可 能 因为 方法 生成 字 市 码 超 长 的 原因 而 导致 编译 失败 。 








Code 属 性 是 Class 文 件 中 最 重要 的 一 个 属性 ， 如 果 把 一 个 Java 程 序 中 
的 信息 分 为 代码 (Code， 方 法 体 里 面 的 Java 代 人 码 〉 和 元 数据 
(Metadata， 包 括 类 、 字 上段、 方法 定义 及 其 他 信息 ) 两 部 分 ， 那 么 在 整 
个 Class 文 件 中 ，Code 属 性 用 于 描述 代码 ， 所 有 的 其 他 数据 项 目 都 用 于 
描述 元 数据 。 了 解 Code 属 性 是 学 习 后 面 天 于 字 市 码 执行 引擎 内 容 的 必要 
基础 ， 能 直接 阅读 字 节 码 也 是 工作 中 分 析 Java 代 码 语义 问题 的 必要 工具 
和 基本 技能 ， 因 此 笔者 准备 了 一 个 比较 详细 的 实例 来 讲解 虚拟 机 是 如 何 
使 用 这 个 属性 的 。 











继续 以 代码 清单 6-1 的 TestClass.class 文 件 为 例 ， 如 图 6-10 所 示 ， 这 
是 上 一 节 分 析 过 的 实例 构造 器 "<init> "方法 的 Code 属 性 。 它 的 操作 数 
栈 的 最 大 深度 和 本 地 变量 表 的 容量 都 为 0x0001， 字 节 码 区 域 所 占 空间 的 
长 度 为 0x0005。 虚 拟 机 读 取 到 字 节 码 区 域 的 长 度 后 ， 按 照 顺 序 依次 读 入 
紧 随 的 5 个 字 节 ， 并 根据 字 节 码 指令 表 翻 译 出 所 对 应 的 字 节 码 指令 。 翻 
译 "2A B7 00 0A B1" 的 过 程 为 : 








1) 读 入 2A， 碍 表 得 0x2A 对 应 的 指令 为 aload_0， 这 个 指令 的 含义 是 
将 第 0 个 Slot 中 为 reference 类 型 的 本 地 变量 推送 到 操作 数 栈 顶 。 


2) 读 入 B7， 查 表 得 0xB7 对 应 的 指令 为 invokespecial， 这 条 指令 的 
作用 是 以 栈 项 的 reference 类 型 的 数据 所 指向 的 对 象 作为 方法 接收 者 ， 调 
用 此 对 象 的 实例 构造 器 方法 、private 方 法 或 者 它 的 父 类 的 方法 。 这 个 方 
法 有 一 个 u2 类 型 的 参数 说 明 具 体 调用 哪 一 个 方法 ， 它 指向 常量 池 中 的 一 
个 CONSTANT_Methodref info 类 型 常量 ， 即 此 方法 的 方法 符号 引用 。 








3) 读 入 00 0A， 这 是 invokespecial 的 参数 ， 查 常量 池 得 0x000A 对 应 
的 常量 为 实例 构造 器 "<init> "方法 的 符号 引用 。 





4) 读 入 B1， 碍 表 得 0xB1 对 应 的 指令 为 retum， 含 义 是 返回 此 方 
法 ， 并 且 返 回 值 为 void。 这 条 指令 执行 后 ， 当 前 方法 结束 。 
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图 6-10 Code 属性 结构 实例 





这 段 字 节 码 虽然 很 得， 但 是 至 少 可 以 看 出 它 的 执行 过 程 中 的 数据 区 
换 、 方 法 调用 等 操作 都 是 基于 栈 〈 操 作 栈 ) 的 。 我 们 可 以 初步 猜测 ; 
Java 庶 拟 机 执行 字 市 码 是 基于 栈 的 体系 结构 。 但 是 与 一 般 基 于 堆栈 的 零 
字 节 指 令 又 不 太一 样 ， 某 些 指 令 〈 如 invokespecial) 后 面 还 会 带 有 参 


数 ， 关 于 虚拟 机 字 市 码 执行 的 讲解 是 后 面 两 草 的 重点 ， 我 们 不 妨 把 这 里 














的 疑问 放 到 第 8 章 去 解决 。 


我 们 再 次 使 用 javap 命 令 把 此 Class 文 件 中 的 另外 一 个 方法 的 字 节 码 
指令 也 计算 出 来 ， 结 果 如 代码 清单 6-4 所 示 。 


代码 清单 6-4 用 javap 命 令 计 算 字 节 码 指令 





/ /原始 Java 代 码 

public class TestClass{ 

private jint m; 

public int inc(){ 

return m+1; 

} 

} 

C:\>javap-verbose TestClass 

/ /常量 表 部 分 的 输出 见 代 码 清单 6-1， 因 版 面 原因 这 里 省 略 掉 

{ 

public org.fenixsoft.clazz.TestClass () ; 

Code: 

Stack=1, Locals=1, Args _ size=] 

0:aload 0 

1:invokespecial#10; //Method java/lang/Object."<init>": ()V 
4:return 

LineNumberTable: 

line 3:0 

LocalVariableTable: 

tart Length Slot Name Signature 

5 0 this Lorg/fenixsoft/clazz/TestClass; 

ublic int inc(); 

ode: 

tack=2, Locals=1, Args size=] 

:aload 0 
:getfield#18; //Field m:I 
:LCONnst 1 

:iadqd 

:ireturn 
LineNumberTable: 
line 8:0 
LocalVariableTable: 
Start Length Slot Name Signature 

0 7 0 this Lorg/fenixsoft/clazz/TestClass; 
} 
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如 果 大 家 注意 到 javap 中 输出 的 "Args_size" 的 值 ， 可 能 会 有 疑问 : 这 
个 类 有 两 个 方法 一 一 实例 构造 器 二 init 之 0 和 inc0， 这 两 个 方法 很 明显 都 
是 没有 参数 的 ， 为 什么 Args_size 会 为 1? 而 且 无 论 是 在 参数 列表 里 还 是 
方法 体内 ， 都 没有 定义 任何 局 部 变量 ， 那 Locals 又 为 什么 会 等 于 1? 如 果 
有 这 样 的 疑问 ， 大 家 可 能 是 忽略 了 一 点 ， 在 任何 实例 方法 里 面 ， 都 可 以 
通过 "this" 关 键 字 访 问 到 此 方法 所 属 的 对 象 。 这 个 访问 机 制 对 Java 程 序 的 
编写 很 重要 ， 而 它 的 实现 却 非常 简单 ， 仅 仅 是 通过 Javac 编 译 器 编译 的 
时 候 把 对 this 关 键 字 的 访问 转变 为 对 一 个 普通 方法 参数 的 访问 ， 然 后 在 
虚拟 机 调用 实例 方法 时 自动 传 入 此 参数 而 已 。 因 此 在 实例 方法 的 局 部 变 
量 表 中 至 少 会 存在 一 个 指向 当前 对 象 实例 的 局 部 变量 ， 局 部 变量 表 中 也 
会 预 留 出 第 一 个 Slot 位 来 存放 对 象 实例 的 引用 ， 方 法 参数 值 从 1 开始 计 
算 。 这 个 处 理 只 对 实例 方法 有 效 ， 如 果 代 码 清单 6-1 中 的 inc() 方 法 声明 


为 static， 那 Args_size 就 不 会 等 于 1 而 是 等 于 0 了 。 






































在 字 节 人 码 指令 之 后 的 是 这 个 方法 的 显 式 异常 处 理 表 下文 简 称 异常 
表 ) 集合 ， 寞 常 表 对 于 Code 属 性 来 说 并 不 是 必须 存在 的 ， 如 代码 清单 6- 
4 中 就 没有 异常 表 生成 。 





异常 表 的 格式 如 表 6-16 所 示 ， 它 包含 4 个 字段 ， 这 些 字段 的 含义 
为 : 如 果 当 字 节 码 在 第 start_pc 行 四 到 第 end_pc 行 之 间 《〈 不 含 第 end_pc 
行 ) 出 现 了 类 型 为 catch_type 或 者 其 子 类 的 异常 〈catch_type 为 指 同一 个 


CONSTANT_Class_info 型 常量 的 索引 ) ， 则 转 到 第 handler_pc 行 继续 处 
理 。 当 catch_type 的 值 为 0 时 ， 代 表 任 意 异 稼 情况 都 需要 转 癌 到 
handler_pc 处 进行 处 理 。 


代 


表 6-16 属性 表 结 构 


| rE 





异常 表 实际 上 是 Java 代 人 码 的 一 部 分 ， 编 译 器 使 用 寞 第 表 而 不 是 简 单 
的 跳 转 命令 3 


来 实现 Java 异 常 及 finally 处 理 机 制 |[4。 


码 清单 6-5 是 一 段 演示 异常 表 如 何 运作 的 例子 ， 这 上段 代码 主要 演 





示 了 在 
前 ， 大 


字 节 人 码 层 面 中 try-catch-finally 是 如 何 实现 的 。 在 阅读 字 节 但 之 
家 不 妨 先 看 看 下 面 的 Java 源 码 ， 想 一 下 这 段 代 码 的 返回 值 在 出 现 


异常 和 不 出 现 异 第 的 情况 下 分 别 应 该 是 多 少 ? 


代码 清单 6-5 异常 表 运作 演示 





//Java 源 人 码 


publie Lnt ine()t 


于 芍 七 
tryl{ 
x=1; 


Xx; 


return x; 
}catch (Exception e) 1 


X=2; 





return x; 





}fin 
X=3; 
} 

} 


allyl{ 





// 编 译 后 的 ByteCcoqe 字 节 码 及 
public int inc() ; 
Code: 





异常 表 


Stack=1, Locals=5, Args size=1 


0:iconst _1//try 块 中 的 x=1 


:istore 1 





:lilistore 4 








:istore 1 


:1rIeturn 


Wh 


| DDN 


:jstore 1 





:jstore 4 











:ijstore 1 








:jreturn 


We 


Lm 
吗 











:jload 4// 将 returnValue 中 的 值 放 到 栈 顶 ， 准 备 给 ireturn 返 回 


:iload 4// 将 returnValue 中 的 值 放 到 栈 顶 ， 准 备 给 ireturn 返 回 


oa 17y 信 汪 2OIebovivatdehy. 和 E 呈 a1 


:iconst 3//finaly 块 中 的 x=3 





:astore 2// 给 catch 中 定义 的 Exception e 赋 值 ， 存 储 在 Slot 2 中 
:iconst 2//catch 块 中 的 x=2 








:iload 1// 保 存 x 到 returnVvalue 中 ， 此 时 x=2 


:iconst 3//finaly 块 中 的 x=3 








:astore 3// 如 果 出 现 了 不 属于 java.lang .Exception 及 其 子 类 的 异常 才 会 走 到 这 





22:iconst 3//finaly 块 中 的 x=3 


23:istore 1 


24:aload 3// 将 异常 放置 到 栈 顶 ， 并 抛 出 


25:athrow 

Exception table: 

from to target type 

0 5 10 Class java/lang/] 
日 5 2221.8ny 

10 16 21 any 























Exception 








编译 器 为 这 段 Java 源 码 生 成 了 3 条 异常 表 记 录 ， 对 应 3 条 可 能 出 现 的 
代码 执行 路 径 。 从 Java 代 码 的 语义 上 讲 ， 这 3 条 执行 路 径 分 别 为 : 


如 果 try 语 句 块 中 出 现 属于 Exception 或 其 子 类 的 异常 ， 则 转 到 catch 


语句 块 处 理 。 


如 果 try 语 句 块 中 出 现 不 属于 Exception 或 其 子 类 的 异常 ， 则 转 到 


finally 语 句 块 处 理 。 
如 果 catch 语 句 块 中 出 现任 何 异常 ， 则 转 到 finally 语 句 块 处 理 。 


返回 到 我 们 上 面 提出 的 问题 ， 这 上 段 代 码 的 返回 值 应 该 是 多 少 ? 对 
Java 语 言 熟 悉 的 读者 应 该 很 容易 说 出 答案 : 如 果 没 有 出 现 异常 ， 返 回 值 
是 1， 如 果 出 现 了 Exception 异 常 ， 返 回 值 是 2， 如 果 出 现 了 Exception 以 外 
的 异常 ， 方 法 非 正 常 退 出 ， 没 有 返回 值 。 我 们 一 起 来 分 析 一 下 字 节 码 的 
执行 过 程 ， 从 字 节 码 的 层面 上 看 看 为 何 会 有 这 样 的 返回 结果 。 





字 厄 人 码 中 第 0~4 行 所 做 的 操作 就 是 将 整数 1 赋值 给 变量 x， 并 且 将 此 
时 zx 的 值 复制 一 份 副本 到 最 后 一 个 本 地 变量 表 的 Slot 中 (这 个 Slot 里 面 的 
值 在 ireturn 指 令 执 行 前 将 会 被 重新 读 到 操作 栈 顶 ， 作 为 方法 返回 值 使 
用 。 为 了 讲解 方便 ， 笔 者 给 这 个 Slot 起 了 个 名 字 : returnValue) 。 如 果 
这 时 没有 出 现 异常 ， 则 会 继续 走 到 第 5~9 行 ， 将 变量 x 赋值 为 3， 然 后 将 
之 前 保存 在 returnValue 中 的 整数 1 读 入 到 操作 栈 顶 ， 最 后 ireturn 指 令 会 以 
int 形 式 返回 操作 栈 顶 中 的 值 ， 方 法 结束 。 如 果 出 现 了 异常 ，PC 寄 存 器 
指针 转 到 第 10 行 ， 第 10~20 行 所 做 的 事情 是 将 2 赋值 给 变量 x， 然 后 将 变 
量 x 此 时 的 值 赋 给 retumValue， 最 后 再 将 变量 x 的 值 改 为 3。 方 法 返回 前 
同样 将 returnValue 中 保留 的 整数 2 读 到 了 操作 栈 项 。 从 第 21 行 开始 的 代 
码 ， 作 用 是 变量 x 的 值 赋 为 3， 并 将 栈 顶 的 异常 殷 出 ， 方 法 结束 。 





尽管 大 家 都 知道 这 段 代码 出 现 腊 常 的 概率 非常 小 ， 但 并 不 影响 它 为 


我 们 演示 寞 第 表 的 作用 。 如 果 大 家 到 这 里 仍然 对 字 市 码 的 运作 过 程 比较 
模糊 ， 其 实 也 不 要 紧 ， 关 于 虚拟 机 执行 字 市 码 的 过 程 ， 本 书 第 8 半 中 将 
会 有 更 详细 的 讲解 。 


2.Exceptions 属 性 


这 里 的 Exceptions 属 性 是 在 方法 表 中 与 Code 属 性 平 级 的 一 项 属性 ， 
读者 不 要 与 前 面 刚刚 讲解 完 的 异常 表 产 生 混 淆 。Exceptions 属 性 的 作用 
是 列举 出 方法 中 可 能 抛 出 的 受 碍 异常 〈Checked Excepitons) ， 也 就 是 方 
法 揪 述 时 在 throws 关 键 字 后 面 列举 的 异常 。 它 的 结构 见 表 6-17。 








表 6-17 属性 表 结 构 


量 











Exceptions 属 性 中 的 number_of _exceptions 项 表示 方法 可 能 抛 出 
number_of_exceptions 种 受 查 异常 ， 每 一 种 受 查 异常 使 用 一 个 
exception_index_table 项 表示 ，exception_index_table 是 一 个 指向 常量 池 中 


CONSTANT_Class_info 型 常量 的 索引 ， 代 表 了 该 受 查 异常 的 类 型 。 
3.LineNumberTable 属 性 


LineNumberTable 属 性 用 于 描述 Java 源 码 行 号 与 字 节 码 行 号 〈 字 节 码 
的 偏 移 量 〉 之 间 的 对 应 关系 。 它 并 不 是 运行 时 必需 的 属性 ， 但 默认 会 生 
成 到 Class 文 件 之 中 ， 可 以 在 Javac 中 分 别 使 用 -g:none 或 -g:lines 选 项 来 取 











消 或 要 求生 成 这 项 信息 。 如 果 选 择 不 生成 LineNumberTable 属 性 ， 对 程 
序 运行 产生 的 最 主要 的 影响 就 是 当 抛 出 异常 时 ， 堆 栈 中 将 不 会 显示 出 错 
的 行 号 ， 并 且 在 调试 程序 的 时 候 ， 也 无 法 按照 源码 行 来 设置 断 点 。 
LineNumberTable 属 性 的 结构 见 表 6-18。 





表 6-18 LineNumberTable 属性 结构 

















光 型 名 称 数 量 
u2 attribute_ name index 1 
u4 attribute length 1 
u2 line number table length 1 
line number info line number table line number table length 


line_number_table 是 一 个 数量 为 line_number_table_length、 类 型 为 
line_number_info 的 集合 ，line_number_info 表 包括 了 start_pc 和 
line_number 两 个 u2 类 型 的 数据 项 ， 前 者 是 字 节 人 码 行 号 ， 后 者 是 Java 源 码 


po 





4.LocalVariableTable 属 性 


LocalVariableTable 属 性 用 于 描述 栈 帧 中 局 部 变量 表 中 的 变量 与 Java 
源码 中 定义 的 变量 之 间 的 关系 ， 它 也 不 是 运行 时 必需 的 属性 ， 但 默认 会 
生成 到 Class 文 件 之 中 ， 可 以 在 Javac 中 分 别 使 用 -g:none 或 -g:vars 选 项 来 
取消 或 要 求生 成 这 项 信息 。 如 果 没 有 生成 这 项 属性 ， 最 大 的 影响 就 是 当 
其 他 人 引用 这 个 方法 时 ， 所 有 的 参数 名 称 都 将 会 丢失 ，IDE 将 会 使 用 庄 
如 arg0、argl 之 类 的 占 位 符 代 蔡 原 有 的 参数 名 ， 这 对 程序 运行 没有 影 
啊 ， 但 是 会 对 代码 编写 带 来 较 大 不 便 ， 而 且 在 调试 期 间 无 法 根据 参数 名 











称 从 上 下 文中 获得 参数 值 。LocalVariableTable 属 性 的 结构 见 表 6-19。 


表 6-19 LocalVariableTable 属性 结构 

















类 型 名 称 数 量 
u2 attribute_ name index 1 
u4 attribute length 1 
u2 local variable table length 1 
local variable_info local variable table local variable table length 


其 中 ，local_variable_info 项 目 代 表 了 一 个 栈 帧 与 源码 中 的 局 部 变量 
的 关联 ， 结 构 见 表 6-20。 


表 6-20 ”local_variable_info 项 目 结构 











类 型 名 称 数 量 
u2 start pe 1 
u2 length 1 
u2 name_index 1 
u2 descriptor index 1 
u2 index 1 





start_pc 和 length 属 性 分 别 代表 了 这 个 局 部 变量 的 生命 周期 开始 的 字 
节 码 偏 移 量 及 其 作用 范围 履 盖 的 长 度 ， 两 者 结合 起 来 就 是 这 个 局 部 变量 
在 字 节 人 码 之 中 的 作用 域 范围 。 








name_index 和 descriptor_index 都 是 指向 常量 池 中 
CONSTANT_Utf8_info 型 常量 的 索引 ， 分 别 代表 了 局 部 变量 的 名 称 以 及 
这 个 局 部 变量 的 描述 符 。 








index 是 这 个 局 部 变量 在 栈 帧 局 部 变量 表 中 Slot 的 位 置 。 当 这 个 变量 





数据 类 型 是 64 位 类 型 时 〈double 和 long) ， 它 占用 的 Slot 为 index 和 


index+1 两 个 。 


顺便 提 一 下 ， 在 JDK 1.5 引 入 泛 型 之 后 ，LocalVariableTable 属 性 增 
加 了 一 个 “姐妹 属性 ?>: LocalVariableTypeTable， 这 个 新 增 的 属性 结构 与 
LocalVariableTable 非 党 相似 ， 仅 仅 是 把 记录 的 字段 描述 符 的 
descriptor_index 蔡 换 成 了 字段 的 特征 签名 〈Signature) ， 对 于 非 泛 型 类 
型 来 说， 描述 符 和 特征 签名 能 描述 的 信息 是 基本 一 致 的 ， 但 是 泛 型 引入 
之 后 ， 由 于 描述 符 中 泛 型 的 参数 化 类 型 被 擦 除 掉 申 ， 描 述 符 就 不 能 准确 
地 描述 泛 型 类 型 了 ， 因 此 出 现 了 LocalVariableTypeTable。 





5.SourceFile 属 性 





SourceFile 属 性 用 于 记录 生成 这 个 Class 文 件 的 源码 文件 名 称 。 这 个 
属性 也 是 可 选 的 ， 可 以 分 别 使 用 Javac 的 -g:none 或 -g:source 选 项 来 关闭 或 
要 求生 成 这 项 信息 。 在 Java 中 ， 对 于 大 多 数 的 类 来 说 ， 类 名 和 文件 名 是 
一 致 的 ， 但 是 有 一 些 特 殊 情 况 〈 如 内 部 类 ) 例外 。 如 果 不 生成 这 项 属 
性 ， 当 抛 出 异常 时 ， 堆 栈 中 将 不 会 显示 出 错 代码 所 属 的 文件 名 。 这 个 属 
性 是 一 个 定 长 的 属性 ， 其 结构 见 表 6-21。 








表 6-21 SourceFile 属性 结构 
类 ”型 名 称 时 


u2 attribute name index 1 





u4 attribute length 1 








u2 sourcefile index 1 








Sourcefile_index 数 据 项 是 指 回 常量 池 中 CONSTANT _Utf8_info 型 党 
量 的 索引 ， 营 量 值 是 源码 文件 的 文件 名 。 


6.ConstantValue 属 性 


ConstantValue 属 性 的 作用 是 通知 虚拟 机 自动 为 静态 变量 赋值 。 只 有 
被 static 关 键 字 修 饰 的 变量 〈 类 变量 ) 才 可 以 使 用 这 项 属性 。 类 似 "int 
X=123" 和 "static int x=123" 这 样 的 变量 定义 在 Java 程 序 中 是 非常 常见 的 事 
情 ， 但 虚拟 机 对 这 两 种 变量 赋值 的 方式 和 时 刻 都 有 所 不 同 。 对 于 非 static 
类 型 的 变量 〈 也 就 是 实例 变量 ) 的 赋值 是 在 实例 构造 器 过 init> 方 法 中 
进行 的 ， 而 对 于 类 变量 ， 则 有 两 种 方式 可 以 选择 : 在 类 构造 器 过 clinit> 
方法 中 或 者 使 用 ConstantValue 属 性 。 目 前 Sun Javac 编 译 器 的 选择 是 : 如 
果 同 时 使 用 final 和 static 来 修饰 一 个 变量 按照 习惯 ,这 里 称 “ 常 量 ” 更 贴 
切 ) ， 并 且 这 个 变量 的 数据 类 型 是 基本 类 型 或 者 java.lang.String 的 话 ， 
束 生 成 ConstantValue 属 性 来 进行 初始 化 ， 如 有 果 这 个 变量 没有 人 被 final 修 
饰 ， 或 者 并 非 基 本 类 型 及 字符 串 ， 则 将 会 选择 在 二 clinit> 方 法 中 进行 初 
始 化 。 




















虽然 有 final 关 键 字 才 更 符合 "ConstantValue" 的 语义 ， 但 虚拟 机 规范 
中 并 没有 强制 要 求 字段 必须 设置 了 ACC_FINAL 标 志 ， 只 要 求 了 有 
ConstantValue 属 性 的 字段 必须 设置 ACC_STATIC 标 志 而 已 ， 对 final 关 键 
字 的 要 求 是 Javac 编 译 器 自己 加 入 的 限制 。 而 对 ConstantValue 的 属性 值 只 
能 限于 基本 类 型 和 String， 不 过 笔者 不 认为 这 是 什么 限制 ， 因 为 此 属性 








的 属性 值 只 是 一 个 常量 池 的 索引 号 ， 由 于 Class 文 件 格 式 的 常量 类 型 中 只 
有 与 基本 属性 和 字符 串 相对 应 的 字面 量 ， 所 以 束 算 ConstantValue 属 性 想 
支持 别 的 类 型 也 无 能 为 力 。ConstantValue 属 性 的 结构 见 表 6-22。 





表 6-22 ConstantValue 属性 结构 










名 称 


attribute name index 1 












attribute_length 





constantvalue index 


从 数据 结构 中 可 以 看 出 ，ConstantValue 属 性 是 一 个 定 长 属性 ， 它 的 
attribute_length 数 据 项 值 必须 固定 为 2。constantvalue_index 数 据 项 代表 了 
常量 池 中 一 个 字面 量 常量 的 引用 ， 根 据 字 段 类 型 的 不 同 ， 字 面 量 可 以 是 
CONSTANT Long info、CONSTANT _ Float_info、 











CONSTANT_Double info、 CONSTANT _Tnteger info、 


CONSTANT_String_info 常 量 中 的 一 种 。 


7.InnerClasses 属 性 














InnerClasses 属 性 用 于 记录 内 部 类 与 宿主 类 之 间 的 关联 。 如 果 一 个 类 
中 定义 了 内 部 类 ， 那 编译 器 将 会 为 它 以 及 它 所 包含 的 内 部 类 生成 
InnerClasses 属 性 。 该 属性 的 结构 见 表 6-23。 


表 6-23 InnerClasses 属性 结构 








类 型 数 量 
u2 attribute name index 1 
u4 attribute_length 1 
u2 number of classes 1 
inner classes_info inner classes number of classes 








数据 项 number_of _ classes 代 表 需 要 记录 多 少 个 内 部 类 信息 ， 每 一 了 1 
内 部 类 的 信息 都 由 一 个 inner_classes_info 表 进行 描述 。inner_classes_info 


表 的 结构 见 表 6-24。 


表 6-24 inner_classes _info 表 的 结构 





类 型 名 称 数 量 
u2 inner class_info_index 
u2 outer class_ info index 





inner name index 








inner class access flags 





inner_class_info index 和 outer_class info index 都 是 指向 常量 池 中 
CONSTANT_Class_info 型 常量 的 索引 ， 分 别 代表 了 内 部 类 和 和 窒 主 类 的 符 


号 引用 。 





inner_name_index 是 指 问 常量 池 中 CONSTANT_Utf8_info 型 常量 的 
索引 ， 代 表 这 个 内 部 类 的 名 称 ， 如 果 是 匿名 内 部 类 ， 那 么 这 项 值 为 0。 


inner_class_access_flags 是 内 部 类 的 访问 标志 ， 类 似 于 类 的 


access_flags， 它 的 取 值 范围 见 表 6-25。 


表 6-25 inner_class_access flags 标志 





























标志 名 称 标志 值 含 义 
ACC PUBLIC 0x0001 内 部 类 是 否 为 public 
ACC PRIVATE 0x0002 内 部 类 是 否 为 private 
ACC PROTECTED 0x0004 内 部 类 是 否 为 protected 
ACC STATIC 0x0008 内 部 类 是 否 为 static 
ACC FINAL 0x0010 内 部 类 是 否 为 fnal 
ACC INTERFACE 0x0020 内 部 类 是 否 为 synhchronized 
ACC ABSTRACT 0x0400 内 部 类 是 否 为 abstract 
ACC SYNTHETIC 0x1000 内 部 类 是 否 并 非 由 用 户 代码 产生 的 
ACC ANNOTATION 0x2000 内 部 类 是 否 是 一 个 注解 
ACC ENUM 0x4000 内 部 类 是 否 是 一 个 枚 举 


8.Deprecated 及 Synthetic 属 性 





Deprecated 和 Synthetic 两 个 属性 都 属于 标志 类 型 的 布尔 属性 ， 只 存 
在 有 和 没有 的 区 别 ， 没 有 属性 值 的 概念 。 


Deprecated 属 性 用 于 表示 某 个 类 、 字 上段 或 者 方法 ， 己 经 被 程序 作者 
定 为 不 再 推荐 使 用 ， 它 可 以 通过 在 代码 中 使 用 @deprecated 注 释 进 行 设 
下 





Synthetic 属性 代表 此 字段 或 者 方法 并 不 是 由 Java 源 码 直接 产生 的 ， 
而 是 由 编译 器 自行 添加 的 ， 在 JDK 1.5 之 后 ， 标 识 一 个 类 、 字 段 或 者 方 
法 是 编译 器 自动 产生 的 ， 也 可 以 设置 它们 访问 标志 中 的 
ACC_SYNTHETIC 标 志 位 ， 其 中 最 典型 的 例子 就 是 Bridge Method。 所 有 
由 非 用 户 代码 产生 的 类 、 方 法 及 字段 都 应 当 至 少 设置 Synthetic 属性 和 
ACC_SYNTHETIC 标 志 位 中 的 一 项 ， 唯 一 的 例外 是 实例 构造 费 "<<init 
二 "方法 和 类 构造 器 "dlinit>>" 方 法 。 


Deprecated 和 Synthetic 属性 的 结构 非常 简单 ， 见 表 6-26。 


表 6-26 Deprecated 及 Synthetic 属性 的 结构 







attribute name index 








attribute length 


其 中 attribute_length 数 据 项 的 值 必 须 为 0x00000000， 因 为 没有 任何 
属性 值 需要 设置 。 


9.StackMapTable 属 性 


StackMapTable 属 性 在 JDK 1.6 发 布 后 增加 到 了 Class 文 件 规范 中 ， 它 
是 一 个 复杂 的 变 长 属性 ， 位 于 Code 属 性 的 属性 表 中 。 这 个 属性 会 在 虚拟 
机 类 加 载 的 字 节 码 验 证 阶段 被 新 类 型 检查 验证 器 〈Type Checker) 使 用 
( 见 7.3.2 节 ) ， 目 的 在 于 代替 以 前 比较 消耗 性 能 的 基于 数据 流 分 析 的 类 
型 推导 验证 器 。 





这 个 类 型 检查 验证 器 最 初 来 源 于 Sheng Liang 〈 听 名 字 似 乎 是 虚拟 机 
团队 中 的 华裔 成 员 ) 为 Java ME CLDC 实 现 的 字 节 码 验 证 器 。 新 的 验证 
器 在 同样 能 保证 Class 文 件 合 法 性 的 前 提 下 ， 省 略 了 在 运行 期 通过 数据 流 
分 析 去 确认 字 节 码 的 行为 逻辑 合法 性 的 步骤 ， 而 是 在 编译 阶段 将 一 系列 
的 验证 类 型 (Verification Types) 直接 记录 在 Class 文 件 之 中 ， 通 过 检查 
这 些 验 证 类 型 代替 了 类 型 推导 过 程 ， 从 而 大 幅 提升 了 字 节 码 验 证 的 性 
能 。 这 个 验证 器 在 JDK 1.6 中 首次 提供 ， 并 在 JDK 1.7 中 强制 代 蔡 原本 基 





于 类 型 推断 的 字 市 码 验证 器 。 关 于 这 个 验证 露 的 工作 原理 ，《Java 虚 拟 
机 规范 (Java SE 7 版 ) 》 人 花费 了 整整 120 页 的 坑 幅 来 讲解 描述 ， 并 且 分 
析 证 明 新 验证 方法 的 严谨 性 ， 笔 者 在 此 不 再 效 述 。 


StackMapTable 属 性 中 包含 零 至 多 个 栈 映射 帧 〈Stack Map 
Frames) ， 每 个 栈 映射 帧 都 显 式 或 隐 式 地 代表 了 一 个 字 节 码 偏 移 量 ， 用 
于 表示 该 执行 到 该 字 节 码 时 局 部 变量 表 和 操作 数 栈 的 验证 类 型 。 类 型 检 
查验 证 器 会 通过 检查 目标 方法 的 局 部 变量 和 操作 数 栈 所 需要 的 类 型 来 确 
定 一 段 字 节 码 指令 是 否 符合 逻辑 约束 。StackMapTable 属 性 的 结构 见 表 6- 
2 














表 6-27 StackMapTable 属性 的 结构 




















类 型 | 名 称 数 量 
u2 attribute name index l 
u4 attribute length 1 
u2 number of entries 1 
stack map frame stack map_frame entries number of entries 


《Java 虚 拟 机 规范 (Java SE 7 版 ) 》 明 确 规定 : 在 版 本 号 大 于 或 等 
于 50.0 的 Class 文 件 中 ， 如 果 方 法 的 Code 属 性 中 没有 附带 StackMapTable 
属性 ， 那 就 意味 着 它 带 有 一 个 隐 式 的 StackMap 属 性 。 这 个 StackMap 属 性 
的 作用 等 同 于 number_of_entries 值 为 0 的 StackMapTable 属 性 。 一 个 方法 
的 Code 属 性 最 多 只 能 有 一 个 StackMapTable 属 性 ， 否 则 将 抛 出 











ClassFormatError 异 常 。 


10.Signature 属 性 


Signature 属 性 在 JDK 1.5 发 布 后 增加 到 了 Class 文 件 规范 之 中 ， 它 是 
一 个 可 选 的 定 长 属性 ， 可 以 出 现 于 类 、 属 性 表 和 方法 表 结 构 的 属性 表 
中 。 在 JDK 1.5 中 大 幅 增 强 了 Java 语 言 的 语法 ， 在 此 之 后 ， 任 何 类 、 接 
口 、 初 始 化 方法 或 成 员 的 泛 型 签名 如 果 包 含 了 类 型 变量 (Type 
Variables) 或 参数 化 类 型 (Parameterized Types) ， 则 Signature 属 性 会 为 
它 记 录 泛 型 签名 信息 。 之 所 以 要 专门 使 用 这 样 一 个 属性 去 记录 泛 型 类 
型 ， 是 因为 Java 语 言 的 泛 型 采用 的 是 擦 除法 实现 的 伪 泛 型 ， 在 字 节 码 
《Code 属 性 ) 中 ， 泛 型 信息 编译 《类 型 变量 、 参 数 化 类 型 ) 之 后 都 通通 
被 擦 除 掉 。 使 用 擦 除法 的 好 处 是 实现 简单 (主要 修改 Javac 编 译 器 ， 虚 
拟 机 内 部 只 做 了 很 少 的 改动 )、 非 常 容易 实现 Backport， 运 行 期 也 能 够 
节省 一 些 类 型 所 占 的 内 存 空间 。 但 坏处 是 运行 期 就 无 法 像 C# 等 有 真 泛 型 
支持 的 语言 那样 ， 将 泛 型 类 型 与 用 户 定 义 的 普通 类 型 同等 对 待 ， 例 如 运 
行 期 做 反射 时 无 法 获得 到 泛 型 信息 。Signature 属 性 就 是 为 了 弥补 这 个 缺 
陷 而 增设 的 ， 现 在 Java 的 反射 API 能 够 获取 泛 型 类 型 ， 最 终 的 数据 来 源 
也 就 是 这 个 属性 。 关 于 Java 泛 型 、Signature 属 性 和 类 型 擦 除 ， 在 第 10 章 
介绍 编译 器 优化 的 时 候 会 通过 一 个 具体 的 例子 来 讲解 。Signature 属 性 的 
结构 见 表 6-28。 














表 6-28 Signature 属性 的 结构 
类 型 名 称 数 量 


attribute name index 










attribute length 








signature index 


其 中 signature_index 项 的 值 必须 是 一 个 对 向量 池 的 有 效 索 引 。 第 量 
池 在 该 索引 处 的 项 必须 是 CONSTANT_Utf8_info 结 构 ， 表 示 类 签名 、 方 
法 类 型 签名 或 字段 类 型 签名 。 如 果 当 前 的 Signature 属 性 是 类 文件 的 属 
性 ， 则 这 个 结构 表示 类 签名 ， 如 果 当 前 的 Signature 属 性 是 方法 表 的 属 
性 ， 则 这 个 结构 表示 方法 类 型 签名 ， 如 果 当 前 Signature 属 性 是 字段 表 的 


属性 ， 则 这 个 结构 表示 字段 类 型 签名 。 














11.BootstrapMethods 属 性 


BootstrapMethods 属 性 在 JDK 1.7 发 布 后 增加 到 了 Class 文 件 规 范 之 

中 ， 它 是 一 个 复杂 的 变 长 属性 ， 位 于 类 文件 的 属性 表 中 。 这 个 属性 用 于 
保存 invokedynamic 指 令 引 用 的 引导 方法 限定 符 。《Java 虚 拟 机 规范 

(Java SE 7 版 )》 规 定 ， 如 果 某 个 类 文件 结构 的 常量 池 中 曾经 出 现 过 
CONSTANT_InvokeDynamic_info 类 型 的 常量 ， 那 么 这 个 类 文件 的 属性 
表 中 必须 存在 一 个 明确 的 BootstrapMethods 属 性 ， 另 外 ， 即 使 
CONSTANT_InvokeDynamic_info 类 型 的 常量 在 常量 池 中 出 现 过 多 次 ， 
类 文件 的 属性 表 中 最 多 也 只 能 有 一 个 BootstrapMethods 属 性 。 
BootstrapMethods 属 性 与 JSR-292 中 的 InvokeDynamic 指 令 和 
java.lang.Invoke 包 关系 非常 密切 ， 要 介绍 这 个 属性 的 作用 ， 必 须 先 弄 清 
楚 InovkeDynamic 指 令 的 运作 原理 ， 笔 者 将 在 第 8 章 专门 用 1 节 篇 幅 去 介 
绍 它们 ， 在 此 先 暂 时 略 过 。 


























目前 的 Javac 暂 时 无 法 生成 ImvokeDynamic 指 令 和 BootstrapMethods 属 


性 ， 必 须 通过 一 些 非 常规 的 手段 才能 使 用 到 它们 ， 也 许 在 不 久 的 将 来 ， 
等 JSR-292 更 加 成 熟 一 些 ， 这 种 状况 就 会 改变 。BootstrapMethods 属 性 的 
结构 见 表 6-29。 


表 6-29 BootstrapMethods 属性 的 结构 


























ES 型 名 称 数 量 
u2 attribute_ name index 1 
u4 attribute_ length 1 
u2 num bootstrap methods 1 
bootstrap_method bootstrap_methods num bootstrap methods 
ls 
其 中 引用 到 的 bootstrap_method 结 构 见 表 6-30。 
表 6-30 bootstrap_method 属性 的 结构 
类 型 数 量 
u2 bootstrap_method ref 1 
u2 num bootstrap arguments 1 
u2 bootstrap arguments num bootstrap_arguments 





BootstrapMethods 属 性 中 ，num_bootstrap_methods 项 的 值 给 出 了 
bootstrap_methods[] 数 组 中 的 引导 方法 限定 符 的 数量 。 而 
bootstrap_methods[] 数 组 的 每 个 成 员 包 含 了 一 个 指 癌 常量 池 
CONSTANT_MethodHandle 结 构 的 索引 值 ， 它 代表 了 一 个 引导 方法 ， 还 
包含 了 这 个 引导 方法 静态 参数 的 序列 〈 可 能 为 空 ) 。 
bootstrap_methods[] 数 组 中 的 每 个 成 员 必须 包含 以 下 3 项 内 容 。 





bootstrap_method_ref:bootstrap_method_ref 项 的 值 必须 是 一 个 对 常量 
池 的 有 效 索 引 。 常 量 池 在 该 索引 处 的 值 必 须 是 一 个 





CONSTANT_MethodHandle_info 结 构 。 


num_bootstrap_arguments:num_bootstrap_arguments 项 的 值 给 出 了 


bootstrap_arguments[] 数 组 成 员 的 数量 。 
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bootstrap_arguments[]: bootstrap_arguments[] 数 组 的 每 个 成 员 必 须 是 
一 个 对 常量 池 的 有 效 索 引 。 常 量 池 在 该 索引 处 必须 是 下 列 结构 之 一 : 
CONSTANT_String_info、CONSTANT_Class_info、 











CONSTANT_Integer info、 CONSTANT_Long info、 
CONSTANT_ Float_info、CONSTANT_Double_info、 
CONSTANT_MethodHandle_info 或 CONSTANT_MethodType_info 3 


四 此 处 字 节 码 的 “ 行 ” 是 一 种 形象 的 描述 ， 指 的 是 字 节 码 相 对 于 方法 体 
开始 的 偏 移 量 ， 而 不 是 Java 源 码 的 行 号 ， 下 同 。 

在 JDK1.4.2 之 前 的 Javac 编 译 器 采用 了 jst 和 ret 指 令 实 现 finally 语 句 ， 但 
1.4.2 之 后 已 经 改 为 编译 器 自动 在 每 段 可 能 的 分 支 路 径 之 后 都 将 finally 语 句 
块 的 内 容 宛 余生 成 一 遍 来 实现 finally 语 义 。 在 JDK 1.7 中 ， 已 经 完全 禁止 
Class 文 件 中 出 现 jst 和 fret 指令 ， 如 果 遇 到 这 两 条 指令 ， 虚 拟 机 会 在 类 加 载 
的 字 节 码 校 验 阶段 抛 出 异常 。 


[3] 详 见 第 10 章 中 关于 语法 糖 部 分 的 内 容 。 


Java 庶 拟 机 的 指令 由 一 个 字 贡 长 度 的、 代表 着 某 种 特定 操作 含义 的 
数字 〈 称 为 操作 码 ，Opcode) 以 及 跟随 其 后 的 零 至 多 个 代表 此 操作 所 需 
参数 〈 称 为 操作 数 ，Operands) 而 构成 。 由 于 Java 虚 拟 机 采用 面 问 操作 
数 栈 而 不 是 寄存 器 的 架构 〈 这 两 种 架构 的 区 别 和 影 啊 将 在 第 8 章 中 探 
讨 ) ， 所 以 大 多 数 的 指令 都 不 包含 操作 数 ， 只 有 一 个 操作 码 。 





字 节 码 指令 集 是 一 种 具有 鲜明 特点 、 优 劣势 都 很 突出 的 指令 集 架 
构 ， 由 于 限制 了 Java 虚 拟 机 操作 码 的 长 度 为 一 个 字 节 〈 即 0~255) ， 这 
意味 着 指令 集 的 操作 码 总 数 不 可 能 超过 256 条 ; 又 由 于 Class 文 件 格 式 放 
弃 了 编译 后 代码 的 操作 数 长 度 对 齐 ， 这 就 意味 着 虚拟 机 处 理 那 些 超过 一 
个 字 节 数据 的 时 候 ， 不 得 不 在 运行 时 从 字 节 中 重建 出 具体 数据 的 结构 ， 
如 果 要 将 一 个 16 位 长 度 的 无 符号 整数 使 用 两 个 无 符号 字 节 存储 起 来 〈 将 
它们 命名 为 bytel 和 byte2) ， 那 它们 的 值 应 该 是 这 样 的 : 














(bytel<=<<=8) |byte2 





这 种 操作 在 菏 种 程度 上 会 导致 解释 执行 字 市 码 时 损失 一 些 性 能 。 但 
这 样 做 的 优势 也 非常 明显 ， 放 弃 了 操作 数 长 度 对 齐 趾 ， 就 意味 着 可 以 省 
略 很 多 填充 和 间 隅 符号 ; 用 一 个 字 节 来 代表 操作 码 ， 也 是 为 了 尽 可 能 获 
得 短小 精干 的 编译 代码 。 这 种 追求 尽 可 能 小 数据 量 、 高 传输 效率 的 设计 











古 由 Java 语 言 设计 之 初 面 同 网 络 、 智 能 家 电 的 技术 背景 所 决定 的 ， 并 一 
直 沿 用 至 今 。 


如 果 不 考虑 异常 处 理 的 话 ， 那 么 Java 虚 拟 机 的 解释 器 可 以 使 用 下 面 
这 个 伪 代 码 当做 最 基本 的 执行 模型 来 理解 ， 这 个 执行 模型 虽然 很 简单 ， 
但 依然 可 以 有 效 地 工作 : 





Qo { 

自动 计算 PC 寄存 器 的 值 加 1; 

根据 Pc 寄存 器 的 指示 位 置 ， 从 字 节 码 流 中 取出 操作 码 ; 
if〔《 字 节 码 存在 操作 数 ) 从 字 节 码 流 中 取出 操作 数 ; 
执行 操作 码 所 定义 的 操作 ; 

}while【〈 字 节 码 流 长 度 >0) ; 














6.4.1 字 节 码 与 数据 类 型 


在 Java 虚 拟 机 的 指令 集中 ， 大 多 数 的 指令 都 包含 了 其 操作 所 对 应 的 
数据 类 型 信息 。 例 如 ，iload 指 令 用 于 从 局 部 变量 表 中 加 载 int 型 的 数据 到 
操作 数 栈 中 ， 而 fload 指 令 加 载 的 则 是 float 类 型 的 数据 。 这 两 条 指令 的 操 
作 在 虚拟 机 内 部 可 能 会 是 由 同一 段 代码 来 实现 的 ， 但 在 Class 文 件 中 它们 
必须 拥有 各 自 独 立 的 操作 码 。 








对 于 大 部 分 与 数据 类 型 相关 的 字 节 码 指令 ， 它 们 的 操作 人 码 助 记 符 中 
都 有 特殊 的 字符 来 表明 专门 为 哪 种 数据 类 型 服务 : i 代 表 对 int 类 型 的 数 
据 操作 ，] 代 表 long,s 代 表 shortb 代 表 byte,c 代 表 char,f 代 表 float,d 代 表 
double,a 代 表 reference。 也 有 一 些 指令 的 助 记 符 中 没有 明确 地 指明 操作 类 


型 的 字母 ， 如 arraylength 指 令 ， 它 没有 代表 数据 类 型 的 特殊 字符 ， 但 操 
作 数 永远 只 能 是 一 个 数组 类 型 的 对 象 。 还 有 另外 一 些 指令 ， 如 无 条 件 跳 
转 指令 goto 则 是 与 数据 类 型 无 关 的 。 


由 于 Java 虚 拟 机 的 操作 码 长 度 只 有 一 个 字 节 ， 所 以 包含 了 数据 类 型 
的 操作 码 就 为 指令 集 的 设计 带 来 了 很 大 的 压力 : 如 果 每 一 种 与 数据 类 型 
相关 的 指令 都 支持 Java 虚 拟 机 所 有 运行 时 数据 类 型 的 话 ， 那 指令 的 数量 
恐怕 就 会 超出 一 个 字 节 所 能 表示 的 数量 范围 了 。 因 此 ，Java 虚 拟 机 的 指 
令 集 对 于 特定 的 操作 只 提供 了 有 限 的 类 型 相关 指令 去 支持 它 ， 换 句 话 
说 ， 指 令 集 将 会 故意 被 设计 成 非 完全 独立 的 (Java 虚 拟 机 规范 中 把 这 种 
特性 称 为 "Not Orthogonal"， 即 并 非 每 种 数据 类 型 和 每 一 种 操作 都 有 对 应 
的 指令 ) 。 有 一 些 单独 的 指令 可 以 在 必要 的 时 候 用 来 将 一 些 不 支持 的 类 
型 转换 为 可 被 支持 的 类 型 。 














表 6-31 列 举 了 Java 虚 拟 机 所 支持 的 与 数据 类 型 相关 的 字 节 码 指令 ， 
通过 使 用 数据 类 型 列 所 代表 的 特殊 字符 人 答 换 opcode 列 的 指令 模板 中 的 
T， 就 可 以 得 到 一 个 具体 的 字 市 码 指令 。 如 果 在 表 中 指令 模板 与 数据 类 
型 两 列 共 同 确定 的 格 为 空 ， 则 说 明 虚 拟 机 不 支持 对 这 种 数据 类 型 执行 这 
项 操作 。 例 如 ，load 指 令 有 操作 int 类 型 的 iload， 但 是 没有 操作 byte 类 型 


的 同类 指令 。 











注意 ， 从 表 6-31 中 可 以 看 出 ， 大 部 分 的 指令 都 没有 文 持 整数 类 型 
byte、char 和 short， 甚 至 没有 任何 指令 文 持 boolean 类 型 。 编 译 器 会 在 编 


译 期 或 运行 期 将 byte 和 short 类 型 的 数据 带 符号 扩展 〈Sign-Extend) 为 相 
应 的 int 类 型 数据 ， 将 boolean 和 char 类 型 数据 零 位 扩展 〈Zero-Extend) 为 
相应 的 int 类 型 数据 。 与 之 类 似 ， 在 处 理 boolean、byte、short 和 char 类 型 
的 数组 时 ， 也 会 转换 为 使 用 对 应 的 int 类 型 的 字 节 码 指令 来 处 理 。 因 此 ， 
大 多 数 对 于 boolean、byte、short 和 char 类 型 数据 的 操作 ， 实 际 上 都 是 使 
用 相应 的 int 类 型 作为 运算 类 型 (Computational Type) 。 


表 6-31 Java 虚拟 机 指令 集 所 支持 的 数据 类 型 


float double 














reference 






short long 





opcode 


Tipush 





byte 














bipush | sipush 














aconst 


aload 


iconst lconst fconst dconst 


| | rome ao | | 


Tconst 


Tload 





( 续 ) 
opcode byte short long float double char reference 
Tinc | ce | 
Taload ee saload iaload i | ad | id | aaload 
Tsub isub lsub fsub dsub 




















Trem irem lrem frem drem 
Tshr ishr lshr 
Tor ior lor 











d2T d2i d21 d2f 
Temp lemp 
Templ | dcmpl 


if _ TcmpOP if icmpOP 
Treturn ireturn lreturn freturn dreturn 


if acmpOP 





areturn 





和 掌握 的 能 力 。 笔 者 将 字 节 码 操作 按 用 途 大 致 分 为 9 类 ， 按 照 分 类 来 为 读 
者 概略 介绍 一 下 这 些 指令 的 用 法 。 如 宁 读 者 需要 了 解 更 详细 的 信息 ， 可 
以 参考 阅读 笔者 翻译 的 《Java 虚 拟 机 规范 (Java SE 7 版 ) 》 的 第 6 章 。 


回 字 节 码 指令 流 基 本 上 都 是 单字 节 对 齐 的 ， 只 
有 "tableswitch" 和 "lookupswitch" 两 条 指令 例外 ， 由 于 它们 的 操作 数 比 较 特 
殊 ， 是 以 4 字 节 为 界 划 分 开 的 ， 所 以 这 两 条 指令 也 需要 预 留 出 相应 的 空 


位 进行 填充 来 实现 对 齐 。 


6.4.2 ”加 载 和 存储 指令 


加 载 和 存储 指令 用 于 将 数据 在 栈 帧 中 的 局 部 变量 表 和 操作 数 栈 ( 见 
第 2 章 关 于 内 存 区 域 的 介绍 ) 之 间 来 回 传输 ， 这 类 指令 包括 如 下 内 容 。 


将 一 个 局 部 变量 加 载 到 操作 栈 : iload、iload <n>、lload、]lload 
<n、fload、fload <n 之 、dload、dload <n 之 、aload、aload_ =n 


。 


将 一 个 数值 从 操作 数 栈 存储 到 局 部 变量 表 : istore、istore_<n>、 
lstore、l]store <n 之 、fstore、fstore <n 之 、dstore、dstore <n>、 


astore、astore <<n 之 。 


将 一 个 常量 加 载 到 操作 数 栈 : bipush、sipush、ldc、1ldc_w、 
ldc2 w、 aconst null、 iconst m1、 iconst < 二 ji 之 、lconst 二 1 之 、fconst 去 


{f 之 、dconst =d>。 





扩充 局 部 变量 表 的 访问 索引 的 指令 : wide。 


存储 数据 的 操作 数 栈 和 局 部 变量 表 主 要 就 是 由 加 载 和 存储 指令 进行 
操作 ， 除 此 之 外 ， 还 有 少量 指令 ， 如 访问 对 象 的 字段 或 数组 元 素 的 指令 
也 会 问 操 作 数 栈 传输 数据 。 


上 面 所 列举 的 指令 助 记 符 中 ， 有 一 部 分 是 以 尖 插 号 结尾 的 (例如 
iload_<n>>) ， 这 些 指令 助 记 符 实际 上 是 代表 了 一 组 指令 例如 iload_ 
<n>， 它 代表 了 iload 0、iload_1、iload_2 和 iload_3 这 几 条 指令 ) 。 这 
几 组 指令 都 是 某 个 带 有 一 个 操作 数 的 通用 指令 〈 例 如 iload) 的 特殊 形 
式 ， 对 于 这 若干 组 特殊 指令 来 说 ， 它 们 省 略 掉 了 显 式 的 操作 数 ， 不 需要 
进行 取 操 作 数 的 动作 ， 实 际 上 操作 数 就 隐 含 在 指令 中 。 除 了 这 点 之 外 ， 
它们 的 语义 与 原生 的 通用 指令 完全 一 致 〈 例 如 iload_0 的 语义 与 操作 数 为 
0 时 的 iload 指 令 语义 完全 一 至)。 这 种 指令 表示 方法 在 本 书 以 及 《Java 
虚拟 机 规范 》 中 都 是 通用 的 。 





6.4.3 ”运算 指令 


运算 或 算术 指令 用 于 对 两 个 操作 数 栈 上 的 值 进行 茶 种 特定 运算 ， 并 
把 结果 重新 存 入 到 操作 栈 顶 。 大 体 上 算术 指令 可 以 分 为 两 种 ， 对 整 型 数 
据 进 行 运算 的 指令 与 对 浮 点 型 数据 进行 运算 的 指令 ， 无 论 是 哪 种 算术 指 
令 ， 都 使 用 Java 虚 拟 机 的 数据 类 型 ， 由 于 没有 直接 文 持 byte、short、 
char 和 boolean 类 型 的 算术 指令 ， 对 于 这 类 数据 的 运算 ， 应 使 用 操作 int 类 
型 的 指令 代 苦 。 整 数 与 浮上 点数 的 算术 指令 在 洪 出 和 被 零 除 的 时 候 也 有 各 
目 不 同 的 行为 表现 ， 所 有 的 算术 指令 如 下 。 




















加 法 指令 : iadd、ladd、fadd、dadd。 
减法 指令 : isub、lsub、fsub、dsub。 
乘法 指令 : imul、lmul、fmul、dmnul。 
除法 指令 : idiv、ldiv、fdiv、ddiv。 

求 余 指令 : irem、lrem、frem、drem。 
取 反 指令 : ineg、lneg、fneg、dneg。 


位 移 指令 : ishl、ishr、iushr、]lshl、]lshr、lushr。 


按 位 或 指令 : ior、lor。 
按 位 与 指令 : iand、land。 
按 位 异 或 指令 : 这 or、]lxor。 
局 部 变量 自 增 指令 : iinc。 


比较 指令 : dcmpg、dcmpl、fcmpg、fcmpl、lcmp。 





Java 虚 拟 机 的 指令 集 直接 支持 了 在 《Java 语 言 规范 》 中 描述 的 各 种 
对 整数 及 浮 点 数 操作 (参见 《Java 语 言 规 范 (第 3 版 )》 中 的 4.2.2 节 和 
4.2.4 节 ) 的 语义 。 数 据 运算 可 能 会 导致 溢出 ， 例 如 两 个 很 大 的 正 整数 相 
加 ， 结 果 可 能 会 是 一 个 负数 ， 这 种 数学 上 不 可 能 出 现 的 溢出 现象 ， 对 于 
程序 员 来 说 是 很 容易 理解 的 ， 但 其 实 Java 虚 拟 机 规范 没有 明确 定义 过 整 
型 数据 溢出 的 具体 运算 结果 ， 仅 规定 了 在 处 理 整 型 数据 时 ， 只 有 除法 指 
令 (Cidiv 和 ldiv) 以 及 求 余 指令 〈irem 和 lrem) 中 当 出 现 除数 为 零 时 会 导 
致 虚拟 机 抛 出 ArithmeticException 异 常 ， 其 余 任何 整 型 数 运 算 场 景 都 不 


应 该 抛 出 运行 时 异常。 














Java 虚 拟 机 规范 要 求 虚 拟 机 实现 在 处 理 浮 点 数 时 ， 必 须 严 格 遵循 
IEEE 754 规 范 中 所 规定 的 行为 和 限制 。 也 就 是 说 ，Java 虚 拟 机 必须 完全 
文 持 IEEE 754 中 定义 的 非 正规 浮 点 数值 (Denormalized Floating-Point 
Numbers) 和 逐 级 下 洪 (Gradual Underflow) 的 运算 规则 。 这 些 特征 将 





会 使 东 些 数值 算法 处 理 起 来 变 得 相对 容易 一 些 。 


Java 虚 拟 机 要 求 在 进行 浮 点 数 运算 时 ， 所 有 的 运算 结果 都 必须 舍 入 
到 适当 的 精度 ， 非 精确 的 结果 必须 售 入 为 可 被 表示 的 最 接近 的 精确 值 ， 
如 休 有 两 种 可 表示 的 形式 与 该 值 一样 接 近 ， 将 优先 选择 最 低 有 效 位 为 堆 
的 。 这 种 舍 入 模式 也 是 IEEE 754 规 范 中 的 默认 售 入 模式 ， 称 为 癌 最 接近 
数 合 入 模式 。 








在 把 浮 点 数 转换 为 整数 时 ，Java 虚 拟 机 使 用 IEEE 754 标 准 中 的 癌 零 
售 入 模式 ， 这 种 模式 的 舍 入 结果 会 导致 数字 被 截断 ， 所 有 小 数 部 分 的 有 
效 字 节 都 会 被 丢弃 掉 。 向 零售 入 模式 将 在 目标 数值 类 型 中 选择 一 个 最 接 
近 但 是 不 大 于 原 值 的 数字 来 作为 最 精确 的 舍 入 结果 。 

















另外 ，Java 虚 拟 机 在 处 理 浮 点 数 运算 时 ， 不 会 抛 出 任何 运行 时 异常 
(这 里 所 讲 的 是 Java 语 言 中 的 异常 ， 请 读者 勿 与 IEEE 754 规 范 中 的 浮 点 
异常 互相 混淆 ，IEEE 754 的 浮 点 异常 是 一 种 运算 信 写 ) ， 当 一 个 操作 产 
生 溢 出 时 ， 将 会 使 用 有 符号 的 无 穷 大 来 表示 ， 如 果 某 个 操作 结果 没有 明 
确 的 数学 定义 的 话 ， 将 会 使 用 NaN 值 来 表示 。 所 有 使 用 NaN 值 作为 操作 
数 的 算术 操作 ， 结 果 都 会 返回 NaN。 





在 对 long 类 型 数值 进行 比较 时 ， 虚 拟 机 末 用 带 符 号 的 比较 方式 ， 而 
对 浮 点 数值 进行 比较 时 〈dcmpg、dcmpl、fcmpg、fcmpl) ， 虚 拟 机 会 采 
用 IEEE 754 规 范 所 定义 的 无 信号 比较 (Nonsignaling Comparisons) 方 


RN 


6.4.4 ”类 型 转换 指令 





类 型 转换 指令 可 以 将 两 种 不 同 的 数值 类 型 进行 相互 转换 ， 这 些 转换 
操作 一 般 用 于 实现 用 户 代码 中 的 显 式 类 型 转换 操作 ， 或 者 用 来 处 理 本 节 
开篇 所 提 到 的 字 节 码 指令 集中 数据 类 型 相关 指令 无 法 与 数据 类 型 一 一 对 
应 的 问题 。 


Java 虚 拟 机 直接 支持 〈 即 转换 时 无 需 显 式 的 转换 指令 ) 以 下 数值 类 
型 的 宽 化 类 型 转换 (Widening Numeric Conversions， 即 小 范围 类 型 器 大 


范围 类 型 的 安全 转换 ) : 
int 类 型 到 long、float 或 者 double 类 型 。 
long 类 型 到 float、double 类 型 。 
float 类 型 到 double 类 型 。 


相对 的 ， 处 理 窗 化 类 型 转换 (Narrowing Numeric Conversions ) 
时 ， 必 须 显 式 地 使 用 转换 指令 来 完成 ， 这 些 转 换 指令 包括 : i2b、i2c、 
i2s、12i、f2i、f21、d2i、d21 和 d2f。 罕 化 类 型 转换 可 能 会 导致 转换 结 
产生 不 同 的 正 负 号 、 不 同 的 数量 级 的 情况 ， 转 换 过 程 很 可 能 会 导致 数值 
的 精度 丢失 。 


在 将 int 或 1ong 关 型 罕 化 转换 为 整数 类 型 T 的 时 候 ， 转 换 过 程 仅仅 是 
简单 地 丢弃 除 最 低位 N 个 字 节 以 外 的 内 容 ，N 是 类 型 T 的 数据 类 型 长 度 ， 
这 将 可 能 导致 转换 结果 与 输入 值 有 不 同 的 正 负 号 。 这 点 很 容易 理解 ， 
为 原来 符号 位 处 于 数值 的 最 高 位 ， 高 位 被 丢 莽 之 后 ， 转 换 结果 的 符 写 束 
取决 于 低 N 个 字 节 的 首位 了 。 











在 将 一 个 浮 扣 值 罕 化 转换 为 整数 类 型 TT 限于 int 或 long 类 型 之 一 ) 
的 时 候 ， 将 遵循 以 下 转换 规则 : 


如 果 浮 点 值 是 NaN， 那 转换 结果 就 是 int 或 long 类 型 的 0。 


如 果 浮 点 值 不 是 无 穷 大 的 话 ， 浮 点 值 使 用 IEEE 754 的 问 零 售 和 人 模式 
取 整 ， 获 得 整数 值 v， 如 果 v 在 目标 类 型 T (int 或 long〉 的 表示 范围 之 
内 ， 那 转换 结果 就 是 v。 


否则 ， 将 根据 v 的 符号 ， 转 换 为 T 所 能 表示 的 最 大 或 者 最 小 正 数 。 


从 double 类 型 到 float 类 型 的 罕 化 转换 过 程 与 IEEE 754 中 定义 的 一 
致 ， 通 过 IEEE 754 同 最 接近 数 合 入 模式 舍 入 得 到 一 个 可 以 使 用 float 类 型 
表示 的 数字 。 如 果 转 换 结果 的 绝对 值 太 小 而 无 法 使 用 float 来 表示 的 话 ， 
将 返回 float 类 型 的 正 负 零 。 如 果 转 换 结 果 的 绝对 值 太 大 而 无 法 使 用 float 
来 表示 的 话 ， 将 返回 float 类 型 的 正 负 无 穷 大 ， 对 于 double 类 型 的 NaN 值 
将 按 规定 转换 为 float 类 型 的 NaN 值 。 


尽管 数据 类 型 窜 化 转换 可 能 会 及 生 上 限 淤 出 、 下 限 海 出 和 精度 丢失 
等 情况 ， 但 是 Java 虚 拟 机 规范 中 明确 规定 数值 类 型 的 罕 化 转换 指令 永远 
不 可 能 导致 虚拟 机 抛 出 运行 时 有 开关。 


6.4.5 ”对象 创建 与 访问 指令 


虽然 类 实例 和 数组 都 是 对 象 ， 但 Java 虚 拟 机 对 类 实例 和 数组 的 创建 
与 操作 使 用 了 不 同 的 字 节 码 指 令 〈 在 第 7 章 会 讲 到 数组 和 普通 类 的 类 型 
创建 过 程 是 不 同 的 ) 。 对 象 创建 后 ， 就 可 以 通过 对 象 访问 指令 获取 对 象 
实例 或 者 数组 实例 中 的 字段 或 者 数组 元 系 ， 这 些 指令 如 下 。 





创建 类 实例 的 指令 : new。 


创建 数组 的 指令 : newarray、anewarray、multianewarray。 





访问 类 字段 (static 字 段 ， 或 者 称 为 类 变量 ) 和 实例 字段 〈 非 static 
字段 ， 或 者 称 为 实例 变量 ) 的 指令 : getfield、putfield、getstatic、 


putstatic 。 


把 一 个 数组 元 素 加 载 到 操作 数 栈 的 指令 : baload、caload、saload、 


iaload、laload、faload、daload、aaload。 


将 一 个 操作 数 栈 的 值 存储 到 数组 元 素 中 的 指令 : bastore、castore、 


sastore、iastore、fastore、dastore、aastore。 
取 数 组 长 度 的 指令 : arraylength。 


检查 类 实例 类 型 的 指令 : instanceof、checkcast。 


6.4.6 ”操作 数 栈 管理 指令 

如 同 操作 一 个 普通 数据 结构 中 的 堆栈 那样 ，Java 虚 拟 机 提供 了 一 些 
用 于 直接 操作 操作 数 栈 的 指令 ， 包 括 : 

将 操作 数 栈 的 栈 顶 一 个 或 两 个 元 素 出 栈 : pop、pop2。 


复制 栈 顶 一 个 或 两 个 数值 并 将 复制 值 或 双 份 的 复制 值 重新 压 入 栈 
顶 : dup、dup2、dup_xl1、dup2_xl1、dup_x2、dup2_x2。 





将 栈 最 顶端 的 两 个 数值 互 换 : swap。 


6.4.7 ”控制 转移 指令 


控制 转移 指令 可 以 让 Java 虚 拟 机 有 条 件 或 无 条 件 地 从 指定 的 位 置 指 
令 而 不 是 控制 转移 指令 的 下 一 条 指令 继续 执行 程序 ， 从 概念 模型 上 理 
解 ， 可 以 认为 控制 转移 指令 就 是 在 有 条 件 或 无 条 件 地 修改 PC 寄存 串 的 
值 。 控 制 转移 指令 如 下 。 





条 件 分 文 : ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、 
if icmpeq、 if icmpne、 if icmplt、 if icmpgt、 if icmple、 if icmpge、 


让 acmpeq 和 让 acmpne。 

复合 条 件 分 支 : tableswitch、]lookupswitch 。 

无 条 件 分 支 : goto、goto_w、jsr、jsr_w、ret。 

在 Java 虚 拟 机 中 有 专门 的 指令 集 用 来 处 理 int 和 reference 类 型 的 条 件 
分 支 比较 操作 ， 为 了 可 以 无 须 明显 标识 一 个 实体 值 是 否 null， 也 有 专门 
的 指令 用 来 检测 null 值 。 

与 前 面 算术 运算 时 的 规则 一 致 ， 对 于 boolean 类 型 、byte 类 型 、char 
类 型 和 short 类 型 的 条 件 分 支 比 较 操 作 ， 都 是 使 用 int 类 型 的 比较 指令 来 完 


成 ， 而 对 于 long 类 型 、float 类 型 和 double 类 型 的 条 件 分 支 比 较 操 作 ， 则 
会 先 执行 相应 类 型 的 比较 运算 指令 (dcmpg、dcmpl、fcmpg、fcmpl、 


lcmp， 见 6.4.3 节 ) ， 运 算 指令 会 返回 一 个 整 型 值 到 操作 数 栈 中 ， 随 后 再 


执行 int 类 型 的 条 件 分 支 比 较 操 作 来 完成 整个 分 支 跳 转 。 由 于 各 种 类 型 的 
比较 最 终 都 会 转化 为 int 关 型 的 比较 操作 ，int 类 型 比较 是 否 方便 完善 就 显 
得 尤为 重要 ， 所 以 Java 虚 拟 机 提供 的 int 类 型 的 条 件 分 支 指令 是 最 为 丰富 


和 强大 的 。 








6.4.8 ”方法 调用 和 返回 指令 


方法 调用 《分 派 、 执 行 过 程 ) 将 在 第 8 章 具 体 讲解 ， 这 里 仅 列举 以 
下 5 条 用 于 方法 调用 的 指令 。 





invokevirtual 指 令 用 于 调用 对 象 的 实例 方法 ， 根 据 对 象 的 实际 类 型 
进行 分 派 ( 虚 方法 分 派 ) ， 这 也 是 Java 语 言 中 最 常见 的 方法 分 派 方式 。 





invokeinterface 指 令 用 于 调用 接口 方法 ， 它 会 在 运行 时 搜索 一 个 实 
现 了 这 个 接口 方法 的 对 象 ， 找 出 适合 的 方法 进行 调用 。 


invokespecial 指 令 用 于 调用 一 些 需 要 特殊 处 理 的 实例 方法 ， 包 括 实 
例 初始 化 方法 、 私 有 方法 和 父 类 方法 。 


invokestatic 指 令 用 于 调用 类 方法 〈static 方 法 ) 。 








invokedynamic 指 令 用 于 在 运行 时 动态 解析 出 调用 点 限定 符 所 引用 的 
方法 ， 并 执行 该 方法 ， 前 面 4 条 调用 指令 的 分 派 逻 辑 都 固化 在 Java 虚 拟 
机 内 部 ， 而 invokedynamic 指 令 的 分 派 逻辑 是 由 用 户 所 设 定 的 引导 方法 决 


定 的 。 


方法 调用 指令 与 数据 类 型 无 天 ， 而 方法 返回 指令 是 根据 返回 值 的 类 
型 区 分 的 ， 包 括 ireturn 〈 当 返回 值 是 boolean、byte、char、short 和 int 类 


型 时 使 用 ) 、lreturmn、freturn、dreturn 和 areturn， 另 外 还 有 一 条 return 指 
令 供 声 明 为 void 的 方法 、 实 例 初 始 化 方法 以 及 类 和 接口 的 类 初始 化 方法 
使 用 。 


6.4.9 ”异常 处 理 指令 


在 Java 程 序 中 显 式 抛 出 异常 的 操作 (throw 语 句 ) 都 由 athrow 指 令 来 
实现 ， 除 了 用 throw 语 句 显 式 抛 出 寞 第 情况 之 外 ，Java 虚 拟 机 规范 还 规定 
了 许多 运行 时 寞 第 会 在 其 他 Java 虚 拟 机 指令 检测 到 异常 状况 时 目 动 抛 
出 。 例 如 ， 在 前 面 介 绍 的 整数 运算 中 ， 当 除数 为 零 时 ， 虚 拟 机 会 在 idiv 


或 ldiv 指 令 中 抛 出 ArithmeticException 异 负 。 


而 在 Java 虚 拟 机 中 ， 处 理 异 常 (catch 语 句 ) 不 是 由 字 节 码 指令 来 实 
现 的 (很 久之 前 曾经 使 用 jsr 和 和 ret 指令 来 实现 ， 现 在 已 经 不 用 了 ) ， 而 是 
采用 异常 表 来 完成 的 。 








6.4.10 ”同步 指令 


Java 虚 拟 机 可 以 文 持 方法 级 的 同步 和 方法 内 部 一 段 指令 序列 的 同 
步 ， 这 两 种 同步 结构 都 是 使 用 管 程 (Monitor) 来 支持 的 。 





方法 级 的 同步 是 隐 式 的 ， 即 无 须 通 过 字 节 码 指令 来 控制 ， 它 实现 在 
方法 调用 和 返回 操作 之 中 。 虚 拟 机 可 以 从 方法 常量 池 的 方法 表 结 构 中 的 
ACC_SYNCHRONIZED 访 问 标志 得 知 一 个 方法 是 否 声明 为 同步 方法 。 
当 方 法 调用 时 ， 调 用 指令 将 会 检查 方法 的 ACC_SYNCHRONIZED 访 问 
标志 是 否 被 设置 ， 如 果 设 置 了 ， 执 行 线程 就 要 求 先 成 功 持 有 管 程 ， 然 后 
才能 执行 方法 ， 最 后 当 方 法 完成 〈 无 论 是 正常 完成 还 是 非 正 常 完成 ) 时 
释放 管 程 。 在 方法 执行 期 间 ， 执 行 线程 持 有 了 管 程 ， 其 他 任何 线程 都 无 
法 再 获取 到 同一 个 管 程 。 如 果 一 个 同步 方法 执行 期 间 抛 出 了 腊 常 ， 并 且 
在 方法 内 部 无 法 处 理 此 异常 ， 那 么 这 个 同步 方法 所 持 有 的 管 程 将 在 异常 
抛 到 同步 方法 之 外 时 自动 释放 。 

















同步 一 段 指令 集 序 列 通常 是 由 Java 语 言 中 的 synchronized 语 句 块 来 表 
示 的 ，Java 虚 拟 机 的 指令 集中 有 monitorenter 和 monitorexit 两 条 指令 来 支 
持 synchronized 关 键 字 的 语义 ， 正 确实 现 synchronized 关 键 字 需要 Javac 编 
译 器 与 Java 虚 拟 机 两 者 共同 协作 支持 ， 壁 如 代码 清单 6-6 中 所 示 的 代码 。 


代码 清单 6-6 ”代码 同步 演示 


一 一 一 一 一 一 一 一 





void onlyMe (Foo f£) { 
synchronized (f) { 
doSomething () ; 

} 

} 











编译 后 ， 这 上段 代码 生成 的 字 节 码 序列 如 下 : 





Method void onlyMe (Foo) 
aload 1// 将 对 象 fE 入 栈 
qup// 复 制 栈 顶 元 素 〈 即 上 的 引用 ) 
astore 2// 将 栈 顶 元 素 存 储 到 局 部 变量 表 Sslot 2 中 
monitorenter// 以 栈 顶 元 素 ( 即 £) 作为 锁 ， 开始 同步 
aload 0// 将 局 部 变量 Slot 0( 即 this 指 针 ) 的 元 素 入 栈 
invokevirtual#5// 调 用 doSsomething () 方 法 

aload 2// 将 局 部 变量 slow 2 的 元 素 〈 即 E) 入 栈 
monitorexit// 退 出 同步 

0 goto 18// 方 法 正常 结束 ， 跳 转 到 18 返 回 

13 astore 3// 从 这 步 开 始 是 异常 路 径 ， 见 下 面 异 常 表 的 Taget 13 
14 aload 2// 将 局 部 变量 Slow 2 的 元 素 〈 即 fE) 入 栈 
由 与 
6 
~ 















































Domn 必 wmwWD 有 局 



































monitorexit// 退 出 同步 
aload 3// 将 局 部 变量 slow 3 的 元 素 〈 即 异常 对 象 ) 入 栈 


























17 athrow// 把 异 人 ) 方法 的 调用 者 
18 return// 方 法 正常 返回 

Exception table: 

Fromlo Target Type 

4 10 13 any 

13 6. ‘J3., any 
































编译 器 必须 确保 无 论 方法 通过 何 种 方式 完成 ， 方 法 中 调用 过 的 每 条 
monitorenter 指 令 都 必须 执行 其 对 应 的 monitorexit 指 令 ， 而 无 论 这 个 方法 


是 正常 结束 还 是 异常 结 





从 代码 清单 6-6 的 字 节 码 序列 中 可 以 看 到 ， 为 了 保证 在 方法 异常 完 
成 时 monitorenter 和 monitorexit 指 令 依 然 可 以 正确 配对 执行 ， 编 译 器 会 自 





动产 生 一 个 异常 处 理 器 ， 这 个 异常 处 理 器 声明 可 处 理 所 有 的 异常 ， 它 的 
日 的 就 是 用 来 执行 monitorexit 指 令 。 


6.5 公有 设计 和 私有 实现 


Java 虚 拟 机 规范 描绘 了 Java 虚拟 机 应 有 的 共同 程序 存储 格式 : Class 
文件 格式 以 及 字 市 码 指令 集 。 这 些 内 容 与 人 硬件、 操作 系统 及 有 具体 的 Java 
虚拟 机 实现 之 间 是 完全 独立 的 ， 虚 拟 机 实现 者 可 能 更 愿意 把 它们 看 做 是 
程序 在 各 种 Java 平 台 实 现 之 间 互 相安 全 地 交互 的 手段 。 

















理解 公有 设计 与 私有 实现 之 间 的 分 界线 是 非 第 有 必要 的 ，Java 虚 拟 
机 实现 必须 能 够 读 取 Class 文 件 并 精确 实现 包含 在 其 中 的 Java 虚 拟 机 代码 
的 语义 。 拿 着 Java 虚 拟 机 规范 一 成 不 变 地 逐 字 实现 其 中 要 求 的 内 容 当 然 
古 一 种 可 行 的 途径 ， 但 一 个 优秀 的 虚拟 机 实现 ， 在 满足 虚拟 机 规范 的 约 
束 下 对 具体 实现 做 出 修改 和 优化 也 是 完全 可 行 的 ， 并 且 虚 拟 机 规范 中 明 
确 喜 励 实现 者 这 样 做 。 只 要 优化 后 Class 文 件 依 然 可 以 被 正确 读 取 ， 并 且 
包含 在 其 中 的 语义 能 得 到 完整 的 保持 ， 那 实现 者 就 可 以 选择 任何 方式 去 
实现 这 些 语义 ， 虚 拟 机 后 台 如 何 处 理 Class 文 件 完 全 是 实现 者 自己 的 事 
情 ， 只 要 它 在 外 部 接口 上 看 起 来 与 规范 描述 的 一 致 即 可 由。 











虚拟 机 实现 者 可 以 使 用 这 种 伸缩 性 来 让 Java 虚 拟 机 获得 更 高 的 性 
能 、 更 低 的 内 存 消耗 或 者 更 好 的 可 移植 性 ， 选 择 哪 种 特性 取决 于 Java 虚 
拟 机 实现 的 目标 和 关注 点 是 什么 。 虚 拟 机 实现 的 方式 主要 有 以 下 两 种 : 





将 输入 的 Java 虚 拟 机 代码 在 加 载 或 执行 时 翻译 成 妨 外 一 种 虚拟 机 的 


将 输入 的 Java 虚 拟 机 代码 在 加 载 或 执行 时 翻译 成 宿主 机 CPU 的 本 地 
指令 集 〈 即 JIT 代 码 生 成 技术 ) 。 


精确 定义 的 虚拟 机 和 目标 文件 格式 不 应 当 对 虚拟 机 实现 者 的 创造 性 
产生 太 多 的 限制 ，Java 虚 拟 机 应 被 设计 成 可 以 允许 有 众多 不 同 的 实现 ， 
并 且 各 种 实现 可 以 在 保持 兼容 性 的 同时 提供 不 同 的 、 新 的 、 有 趣 的 解决 


方案 。 


[1 
器 


要 访问 一 些 通常 认为 是 “虚拟 机 后 台 ” 的 元 素 。 


这 里 其 实 多 少 存在 一 些 例外 : 璧 如 调试 器 (Debuggers) 、 性 能 监视 
( 


Profilers) 和 即时 编译 器 (Just-In-Time Code Generator) 等 都 可 能 需 


6.6 ” Class 文件 结构 的 发 展 


Class 文 件 结构 自 Java 虚 拟 机 规范 第 1 版 订立 以 来 ， 已 经 有 十 多 年 的 
历史 。 这 十 多 年 间 ，Java 技 术 体系 有 了 翻天 履 地 的 改变 ，JDK 的 版 本 号 
己 经 从 1.0 提 升 到 了 1.7。 相 对 于 语言 、API 以 及 Java 技 术 体 系 中 其 他 方面 
的 变化 ，Class 文 件 结构 一 直 处 于 比较 稳定 的 状态 ，Class 文 件 的 主体 结 
构 、 字 节 码 指令 的 语义 和 数量 几乎 没有 出 现 过 变动 踢 ， 所 有 对 Class 文 件 
格式 的 改进 ， 都 集中 在 向 访问 标志 、 属 性 表 这 些 在 设计 上 就 可 扩展 的 数 
据 结构 中 添加 内 容 。 


如 果 以 《Java 虚 拟 机 规范 《第 2 版 ) 》 为 基准 进行 比较 的 话 ， 那 么 
在 后 续 Class 文 件 格式 的 发 展 过 程 中 ， 访 问 标志 里 新 加 入 了 
ACC_SYNTHETIC、ACC_ANNOTATION、ACC_ENUM、 





ACC_BRIDGE、ACC_VARARGS 共 5 个 标志 。 而 属性 表 集 合 中 ， 在 JDK 
1.5 到 JDK 1.7 版 本 之 间 一 共 增 加 了 12 项 新 的 属性 ， 这 些 属性 大 部 分 用 于 
支持 Java 中 许多 新 出 现 的 语言 特性 ， 如 枚 举 、 变 长 参数 、 泛 型 、 动 态 注 
解 等 。 还 有 一 些 是 为 了 文 持 性 能 改进 和 调试 信息 ， 璧 如 JDK 1.6 的 新 类 
型 校 验 器 的 StackMapTable 属 性 和 对 非 Java 代 码 调试 中 用 到 的 
SourceDebugExtension 属 性 。 


Class 文 件 格式 所 有 具备 的 平台 中 立 〈 不 依赖 于 特定 硬件 及 操作 系 


统 ) 、 紧 凑 、 稳 定 和 可 扩展 的 特点 ， 是 Java 技 术 体 系 实现 平台 无 关 、 语 
言 无 关 两 项 特性 的 重要 支柱 。 


[十 余年 间 ， 字 节 码 的 数量 和 语义 只 发 生 过 屈指 可 数 的 几 次 变动 ， 例 
如 ，JDK1.0.2 时 改动 过 invokespecial 指 令 的 语义 ; JDK 1.7 增 加 了 


invokedynamic 指 令 ， 人 禁止 了 tet 和 jst 指 令 。 


6.7 ”本章 小 结 


Class 文 件 是 Java 虚 拟 机 执行 引擎 的 数据 入 口 ， 也 是 Java 技 术 体系 的 
基础 构成 之 一 。 了 解 Class 文 件 的 结构 对 后 面 进一步 了 解 虚拟 机 执行 引擎 
有 很 重要 的 意义 。 





本 章 详 细 讲 解 了 Class 文 件 结构 中 的 各 个 组 成 部 分 ， 以 及 每 个 部 分 的 
定义 、 数 据 结 构 和 使 用 方法 。 通 过 代码 清单 6-1 的 Java 代 码 与 它 的 Class 
文件 样 例 ， 以 实战 的 方式 演示 了 Class 的 数据 是 如 何 存储 和 访问 的 。 从 第 
7 章 开始 ， 我 们 将 以 动态 的 、 运 行 时 的 角度 去 看 看 字 市 码 流 在 虚拟 机 执 
行 引擎 中 是 怎样 被 解 释 执行 的 。 


第 7 章 ” 虚 拟 机 关 加 载 机 制 


代码 编译 的 结果 从 本 地 机 器 人 码 转变 为 字 节 人 码 ， 是 存储 格式 发 展 的 一 
小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


7.1 概述 


上 一 章 我 们 了 解 了 Class 文 件 存储 格式 的 具体 细节 ， 在 Class 文 件 中 
描述 的 各 种 信息 ， 最 终 都 需要 加 载 到 虚拟 机 中 之 后 才能 运行 和 使 用 。 而 
虚拟 机 如 何 加 载 这 些 Class 文 件 ? Class 文 件 中 的 信息 进入 到 虚拟 机 后 会 
发 生 什么 变化 ?这 些 都 是 本 章 将 要 讲解 的 内 容 。 








虚拟 机 把 描述 类 的 数据 从 Class 文 件 加 载 到 内 存 ， 并 对 数据 进行 校 
验 、 转 换 解析 和 初始 化 ， 最 终 形成 可 以 被 虚拟 机 直接 使 用 的 Java 类 型 ， 
这 就 是 虚拟 机 的 类 加 载 机 制 。 





与 那些 在 编译 时 需要 进行 连接 工作 的 语言 不 同 ， 在 Java 语 言 里 面 ， 
类 型 的 加 载 、 连 接 和 初始 化 过 程 都 是 在 程序 运行 期 间 完 成 的 ， 这 种 策略 
虽然 会 令 类 加 载 时 稍微 增加 一 些 性 能 开销 ， 但 是 会 为 Java 应 用 程序 提供 
高 度 的 灵活 性 ，Java 里 天 生 可 以 动态 扩展 的 语言 特性 就 是 依赖 运行 期 动 
态 加 载 和 动态 连接 这 个 特点 实 现 的。 例如 ， 如 果 编 写 一 个 面 疝 接口 的 应 
用 程序 ， 可 以 等 到 运行 时 再 指定 其 实际 的 实现 类 ; 用户 可 以 通过 Java 预 














定义 的 和 自 定义 类 加 载 器 ， 让 一 个 本 地 的 应 用 程序 可 以 在 运行 时 从 网 络 
或 其 他 地 方 加 载 一 个 二 进 制 流 作为 程序 代码 的 一 部 分 ， 这 种 组 装 应 用 程 
序 的 方式 目前 已 广泛 应 用 于 Java 程 序 之 中 。 从 最 基础 的 Applet、JSP 到 相 
对 复杂 的 OSGi 技 术 ， 都 使 用 了 Java 语 言 运 行 期 类 加 载 的 特性 。 











为 了 避免 语言 表达 中 可 能 产生 的 偶 兰 ， 在 本 章 正 式 开始 之 前 ， 笔 者 
先 设立 两 个 语言 上 的 约定 : 第 一 ， 在 实际 情况 中 ， 每 个 Class 文 件 都 有 可 
能 代表 着 Java 语 言 中 的 一 个 类 或 接口 ， 后 文中 直接 对 “类 ”的 描述 都 包括 
了 类 和 接口 的 可 能 性 ， 而 对 于 类 和 接口 需要 分 开 描述 的 场景 会 特别 指 
明 ; 第 二 ， 与 前 面 介绍 Class 文 件 格式 时 的 约定 一 致 ， 笔 者 本 章 所 提 到 
的 “Class 文 件 ? 并 非特 指 某 个 存在 于 具体 磁盘 中 的 文件 ， 这 里 所 说 
的 “Class 文 件 ” 应 当 是 一 串 二 进 制 的 字 节 流 ， 无 论 以 何 种 形式 存在 都 可 
以 。 























7.2 ”类 加 载 的 时 机 


类 从 被 加 载 到 虚拟 机 内 存 中 开始 ， 到 钊 载 出 内 存 为 止 ， 它 的 整个 生 
命 周 期 包括 : 加 载 (Loading) 、 验 证 〈Verification ) 、 准 备 
(Preparation) 、 解 析 (Resolution) 、 初 始 化 〈Initialization ) 、 使 用 
CUsing) 和 外 载 (Unloading) 7 个 阶段 。 其 中 验证 、 准 备 、 解 析 3 个 音 
分 统称 为 连接 (Linking) ， 这 7 个 阶段 的 发 生 顺 序 如 图 7-1 所 示 。 


连接 (Linking ) 


加 载 验证 准 解析 
Loading rerificati eparati Resolution 
使 用 初始 化 
Using Initialization 


图 7-1 类 的 生命 周期 














图 7-1 中 ， 加 载 、 验 证 、 准 备 、 初 始 化 和 外 载 这 5 个 阶段 的 顺序 是 确 
定 的 ， 类 的 加 载 过 程 必须 按照 这 种 顺序 按部就班 地 开始 ， 而 解析 阶段 则 
不 一 定 : 它 在 茶 些 情况 下 可 以 在 初始 化 阶段 之 后 再 开始 ， 这 是 为 了 文 持 
Java 语 言 的 运行 时 绑 定 〈 也 称 为 动态 绑 定 或 晚期 绑 定 ) 。 注 意 ， 这 里 笔 
者 写 的 是 按部就班 地 “开始 "， 而 不 是 按部就班 地 “进行 ”或 “完成 ”强调 

是 因为 这 些 阶段 通常 都 是 互相 交 义 地 混合 式 进行 的 ， 通 常会 在 一 个 





阶段 执行 的 过 程 中 调用 、 激 活力 外 一 个 阶段 。 


什么 情况 下 需要 开始 类 加 载 过 程 的 第 一 个 阶段 : 加载? Java 虚 拟 机 
规范 中 并 没有 进行 强制 约束 ， 这 点 可 以 交 给 虚拟 机 的 具体 实现 来 自由 把 
握 。 但 是 对 于 初始 化 阶段 ， 虚 拟 机 规范 则 是 严格 规定 了 有 且 只 有 5 种 情 
况 必须 立即 对 类 进行 “初始 化 ”( 而 加 载 、 验 证 、 准 备 自然 需要 在 此 之 前 
开 旭 ): 














1) 遇 到 new、getstatic、Ppnutstatic 或 invokestatic 这 4 条 字 节 码 指令 
时 ， 如 果 类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 生 成 这 4 条 指 
令 的 最 常见 的 Java 代 码 场景 是 : 使 用 new 关 键 字 实例 化 对 象 的 时 候 、 读 
取 或 设置 一 个 类 的 静态 字段 〈 被 fnal 修 饰 、 已 在 编译 期 把 结果 放 入 常量 
池 的 静态 字段 除外 ) 的 时 候 ， 以 及 调用 一 个 类 的 静态 方法 的 时 候 。 


2) 使 用 java.lang.reflect 包 的 方法 对 类 进行 反射 调用 的 时 候 ， 如 果 类 
没有 进行 过 初始 化 ， 则 需要 先 触 发 其 初始 化 。 


3) 当初 始 化 一 个 类 的 时 候 ， 如 果 发 现 其 父 类 还 没有 进行 过 初始 
化 ， 则 需要 移 触 发 其 父 类 的 初始 化 。 


4) 当 虚 拟 机 局 动 时 ， 用 户 需 要 指定 一 个 要 执行 的 主 类 〈 包 合 main() 
方法 的 那个 类 ) ， 虚 拟 机 会 先 初 始 化 这 个 主 类 。 


5) 当 使 用 JDK 1.7 的 动态 语言 支持 时 ， 如 果 一 个 


java.lang.invoke.MethodHandle 实 例 最 后 的 解析 结果 REF_getStatic、 





REF_putStatic、REF_invokeStatic 的 方法 句柄 ， 并 且 这 个 方法 句柄 所 对 
应 的 类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 


对 于 这 5 种 会 触发 类 进行 初始 化 的 场景 ， 虚 拟 机 规范 中 使 用 了 一 个 
很 强烈 的 限定 语 : “有 且 只 有 ”， 这 5 种 场景 中 的 行为 称 为 对 一 个 类 进行 
主动 引用 。 除 此 之 外 ， 所 有 引用 类 的 方式 都 不 会 触发 初始 化 ， 称 为 被 动 
引用 。 下 面 举 3 个 例子 来 说 明 何 为 被 动 引 用 ， 分 别 见 代码 清单 7-1~ 代 码 
清单 7-3。 


代码 清单 7-1 被 动 引 用 的 例子 之 一 











package org.fenixsoft.classloading:; 

/** 

* 被 动 使 用 类 字段 演示 一 : 

* 通 过 子 类 引用 父 类 的 静态 字段 ， 不 会 导致 子 类 初始 化 
*x*/ 

public class SuperClasst{ 

Statliel 

System.out.println ("SuperClass init! ") ; 
} 

public static int value=123; 

} 
public class SubClass extends SuperClassit 
statiel 

System.out.println ("SubClass init! ") ; 

} 

} 

/** 

* 非 主动 使 用 类 字段 演示 

*x*/ 
public class NotInitializationtf{ 

public static void main (String[]args) 1 
System.out.println (SubCclass.value) ; 


} 













































































上 述 代码 运行 之 后 ， 只 会 输出 "SuperClass init! "， 而 不 会 输 
出 "SubClass init! "。 对 于 静态 字段 ， 只 有 直接 定义 这 个 字段 的 类 才 会 被 
初始 化 ， 因 此 通过 其 子 类 来 引用 父 类 中 定义 的 静态 字段 ， 只 会 触发 父 类 
的 初始 化 而 不 会 触发 子 类 的 初始 化 。 至 于 是 否 要 触发 子 类 的 加 载 和 验 
证 ， 在 虚拟 机 规范 中 并 未 明确 规定 ， 这 点 取决 于 虚拟 机 的 具体 实现 。 对 
于 Sun HotSpot 虚 拟 机 来 说 ， 可 通过 -XX:+TraceClassLoading 参 数 观 察 到 
此 操作 会 导致 子 类 的 加 载 。 











代码 清单 7-2 ”和 被动 引用 的 例子 之 二 











package org.fenixsoft.classloading:; 

/** 

* 被 动 使 用 类 字段 演示 二 : 

* 通 过 数组 定义 来 引用 类 ， 不 会 触发 此 类 的 初始 化 
*x*/ 

public class NotInitializationt 

public static void main (String[]args) 1 
SuperClass[]sca=new SuperClass[10]; 

} 

} 









































为 了 节省 版 面 ， 这 段 代码 复 用 了 代码 清单 7-1 中 的 SuperClass， 运 行 
之 后 发 现 没有 输出 "SuperClass init! "， 说 明 并 没有 触发 类 
org.fenixsoft.classloading.SuperClass 的 初始 化 阶段 。 但 是 这 段 代 码 里 面 触 
发 了 另外 一 个 名 为 "[Lorg.fenixsoft.classloading.SuperClass" 的 类 的 初始 化 
阶段 ， 对 于 用 户 代 码 来 说 ， 这 并 不 是 一 个 合法 的 类 名 称 ， 它 是 一 个 由 虚 





拟 机 自动 生成 的 、 直 接 继 承 于 java.lang.Object 的 子 类 ， 创 建 动 作 由 字 节 
码 指令 newarray 触 发 。 


这 个 类 代表 了 一 个 元 素 类 型 为 org.fenixsoft.classloading.SuperClass 的 
一 维 数 组 ， 数 组 中 应 有 的 属性 和 方法 (用 户 可 直接 使 用 的 只 有 被 修饰 为 
public 的 length 属 性 和 clone(0) 方 法 ) 都 实现 在 这 个 类 里 。Java 语 言 中 对 数 
组 的 访问 比 C/C++ 相 对 安全 是 因为 这 个 类 封装 了 数组 元 素 的 访问 方法 
川 ， 而 C/C++ 直接 翻译 为 对 数组 指针 的 移动 。 在 Java 语 言 中 ， 当 检查 到 
发 生 数 组 越界 时 会 抛 出 java.lang.ArrayIndexOutOfBoundsException 异 常 。 





代码 清单 7-3 ”被动 引用 的 例子 之 三 











package org.fenixsoft.classloading:; 

/** 

* 被 动 使 用 类 字段 演示 三 : 

* 常 量 在 编译 阶段 会 存 入 调用 类 的 常量 池 中 ， 本 质 上 并 没有 直接 引用 到 定义 常量 的 类 ， 因 此 
不 会 触发 定义 常量 的 类 的 初始 化 。 

*x*/ 

public class ConstClasst{ 

Statied 

System.out.println ("ConstClass init! ") ; 

} 

public static final String HELLOWORLD="hello world"; 

} 







































































/** 

* 非 主动 使 用 类 字段 演示 

*x*/ 

public class NotIinitializationt{ 














public static void main (String[]args) 1 
System.out.println (ConstClass.HELLOWORLD) ; 
} 

} 

















上 述 代 码 运 行 之 后 ， 也 没有 输出 "ConstClass init! "， 这 是 因为 虽然 
在 Java 源 码 中 引用 了 ConstClass 类 中 的 常量 HELLOWORLD， 但 其 实在 
编译 阶段 通过 常量 传播 优化 ， 已 经 将 此 常量 的 值 "hello world" 存 储 到 了 


NotInitialization 类 的 常量 池 中 ， 以 后 NotInitialization 对 常量 





ConstClass.HELLOWORLD 的 引用 实际 都 被 转化 为 NotInitialization 类 对 
自 寻 第 量 池 的 引用 了 。 也 就 是 说， 实际 上 NotInitialization 的 Class 文 件 之 
中 并 没有 ConstClass 类 的 符号 引用 入 口 ， 这 两 个 类 在 编译 成 Class 之 后 就 
不 存在 任何 联系 了 。 


接口 的 加 载 过 程 与 类 加 载 过 程 稍 有 一 些 不 同 ， 针 对 接口 需要 做 一 些 
特殊 说 明 : 接口 也 有 初始 化 过 程 ， 这 点 与 类 是 一 致 的 ， 上 面 的 代码 都 是 
用 静态 语句 块 "static{}" 来 输出 初始 化 信息 的 ， 而 接口 中 不 能 使 
用 "static{}" 语 句 块 ， 但 编译 器 仍然 会 为 接口 生成 "二 dlinit 二 0" 类 构造 
器 5 培 ， 用 于 初始 化 接口 中 所 定义 的 成 员 变 量 。 接 口 与 类 真正 有 所 区 别 的 

是 前 面 讲述 的 5 种 “有 且 仅 有 ”需要 开始 初始 化 场景 中 的 第 3 种 : 当 一 个 类 
在 初始 化 时 ， 要 求 其 父 类 全 部 都 已 经 初始 化 过 了 ， 但 是 一 个 接口 在 初始 
化 时 ， 并 不 要 求 其 父 接口 全 部 都 完成 了 初始 化 ， 只 有 在 真正 使 用 到 父 接 
口 的 时 候 (如 引用 接口 中 定义 的 常量 ) 才 会 初始 化 。 








四 准确 地 说 ， 越 界 检查 不 是 封装 在 数组 元 素 访问 的 类 中 ， 而 是 封装 在 数 
组 访问 的 xaload、xastote 字 节 码 指令 中 。 


加 关于 类 构造 器 <clinit> 和 方法 构造 器 <init> 的 生成 过 程 和 作用 ， 可 参 


见 第 10 章 的 相关 内 容 。 


7.3 ”类 加 载 的 过 程 


接 下 来 我 们 详细 讲解 一 下 Java 虚 拟 机 中 类 加 载 的 全 过 程 ， 也 就 是 加 
载 、 验 证 、 准 备 、 解 析 和 初始 化 这 5 个 阶段 所 执行 的 具体 动作 。 


7.3.1 加 载 
“加 载 * 是 “类 加 载 ”(Class Loading) 过 程 的 一 个 阶段 ， 希 望 读 者 没 


有 混淆 这 两 个 看 起 来 很 相似 的 名 词 。 在 加 载 阶段 ， 虚 拟 机 需要 完成 以 下 
3 件 事情 : 





1) 通过 一 个 类 的 全 限定 名 来 获取 定义 此 类 的 二 进 制 字 市 流 。 


2) 将 这 个 字 市 流 所 代表 的 静态 存储 结构 转化 为 方法 区 的 运行 时 数 
所 结构 。 


3) 在 内 存 中 生成 一 个 代表 这 个 类 的 java.lang.Class 对 象 ， 作 为 方法 
区 这 个 类 的 各 种 数据 的 访问 入 口 。 


虚拟 机 规范 的 这 3 点 要 求 其 实 并 不 算 具 体 ， 因 此 虚拟 机 实现 与 具体 
应 用 的 灵活 度 都 是 相当 大 的 。 例 如 “通过 一 个 类 的 全 限定 名 来 获取 定义 
此 类 的 二 进 制 字 市 流 ” 这 条 ， 它 没有 指明 二 进 制 字 市 流 要 从 一 个 Class 文 


件 中 获取 ， 准 确 地 说 是 根本 没有 指明 要 从 哪里 获取 、 怎 样 获取 。 虚 拟 机 








设计 团队 在 加 载 阶段 搭建 了 一 个 相当 开放 的 、 广 阔 的 “舞台 ”，Java 发 展 
历程 中 ， 充 满 创 造 力 的 开发 人 员 则 在 这 个 “舞台 ”上 玩 出 了 各 种 花样 ， 许 
多 举足轻重 的 Java 技 术 都 建立 在 这 一 基础 之 上 ， 例 如: 





从 ZIP 包 中 读 取 ， 这 很 常见 ， 最 终 成 为 日 后 JAR、EAR、WAR 格 式 
的 基础 。 


从 网 络 中 获取 ， 这 种 场景 最 典型 的 应 用 就 是 Applet。 








运行 时 计算 生成 ， 这 种 场景 使 用 得 最 多 的 就 是 动态 代理 技术 ， 在 
java.lang.reflect.Proxy 中 ， 束 是 用 了 ProxyGenerator.generateProxyClass 来 
为 特定 接口 生成 形式 为 "*$Proxy" 的 代理 类 的 二 进 制 字 节 流 。 


由 其 他 文件 生成 ， 典 型 场景 是 JSP 应 用 ， 即 由 JSP 文 件 生 成 对 应 的 


Class 类 。 


从 数据 库 中 读 取 ， 这 种 场景 相对 少见 些 ， 例 如 有 些 中 间 件 服务 器 
(如 SAP Netweaver) 可 以 选择 把 程序 安装 到 数据 库 中 来 完成 程序 代码 
在 集群 间 的 分 发 。 





相对 于 类 加 载 过 程 的 其 他 阶段 ， 一 个 非 数 组 类 的 加 载 阶 段 (准确 地 
说 ， 是 加 载 阶段 中 获取 类 的 二 进 制 字 市 流 的 动作 ) 是 开 及 人 员 可 探 性 最 
强 的 ， 因 为 加 载 阶段 既 可 以 使 用 系统 提供 的 引导 类 加 载 器 来 完成 ， 也 可 





以 由 用 户 目 定义 的 类 加 载 器 去 完成 ， 开 发 人 员 可 以 通过 定义 目 己 的 类 加 
载 费 去 控制 学 市 流 的 获取 方式 〈 即 重 写 一 个 类 加 载 器 的 loadClass() 方 
i 


对 于 数组 类 而 言 ， 和 情况 束 有 所 不 同 ， 数 组 类 本 喘 不 通过 类 加 载 器 创 
建 ， 它 是 由 Java 虚 拟 机 直接 创建 的 。 但 数组 类 与 类 加 载 器 仍然 有 很 密切 
的 关系 ， 因 为 数组 类 的 元 素 类 型 (Element Type， 指 的 是 数组 去 掉 所 有 
维度 的 类 型 ) 最 终 是 要 靠 类 加 载 器 去 创建 ， 一 个 数组 类 下面 简 称 为 
C) 创建 过 程 就 章 循 以 下 规则 : 











如 果 数 组 的 组 件 类 型 (Component Type， 指 的 是 数组 去 掉 一 个 维度 
的 类 型 ) 古 引 用 类 型 ， 那 就 递归 采用 丁 中 定义 的 加 载 过 程 去 加 载 这 个 
组 件 类 型 ， 数 组 C 将 在 加 载 该 组 件 类 型 的 类 加 载 句 的 类 名 称 空间 上 被 标 
识 〈 这 点 很 重要 ， 在 7.4 节 会 介绍 到 ， 一 个 类 必须 与 类 加 载 器 一 起 确定 


唯一 性 ) 。 





如 果 数 组 的 组 件 类 型 不 是 引用 类 型 “例如 int[] 数 组 ) ，Java 虚 拟 机 
将 会 把 数组 C 标 记 为 与 引导 类 加 载 嚣 关联。 


数组 类 的 可 见 性 与 它 的 组 件 类 型 的 可 见 性 一 致 ， 如 果 组 件 类 型 不 是 
引用 类 型 ， 那 数组 类 的 可 见 性 将 默认 为 public。 


关于 类 加 载 器 的 话题 ， 笔 者 将 在 本 章 的 7.4 节 专门 讲述 。 





加 载 阶段 完成 后 ， 虚 拟 机 外 部 的 二 进 制 字 节 流 就 按照 虚拟 机 所 需 的 
格式 存储 在 方法 区 之 中 ， 方 法 区 中 的 数据 存储 格式 由 虚拟 机 实现 自行 定 
义 ， 虚 拟 机 规范 未 规定 此 区 域 的 具体 数据 结构 。 然 后 在 内 存 中 实例 化 一 
个 java.lang.Class 类 的 对 象 ( 并 没有 明确 规定 是 在 Java 堆 中 ， 对 于 HotSpot 
虚拟 机 而 言 ，Class 对 象 比较 特殊 ， 它 虽然 是 对 象 ， 但 是 存放 在 方法 区 里 
面 ) ， 这 个 对 象 将 作为 程序 访问 方法 区 中 的 这 些 类 型 数据 的 外 部 接口 。 








加 载 阶段 与 连接 阶段 的 部 分 内 容 《〈 如 一 部 分 字 节 码 文件 格式 验证 动 
作 ) 是 交 叉 进行 的 ， 加 载 阶段 尚未 完成 ， 连 接 阶 段 可 能 已 经 开始 ， 但 这 
些 夹 在 加 载 阶段 之 中 进行 的 动作 ， 仍 然 属 于 连接 阶段 的 内 容 ， 这 两 个 阶 
段 的 开始 时 间 仍 然 保持 独 固 定 的 移 后 顺序 。 


7.3.2 ”验证 





验证 是 连接 阶段 的 第 一 步 ， 这 一 阶段 的 目的 是 为 了 确保 Class 文 件 的 
字 节 流 中 包含 的 信息 符合 当前 虚拟 机 的 要 求 ， 并 且 不 会 危害 虚拟 机 目 吴 
的 安全 。 





Java 语 言 本 吴 是 相对 安全 的 语言 《依然 是 相对 于 C/C++ 来 说 ) ， 使 
用 纯粹 的 Java 代 码 无 法 做 到 诸如 访问 数组 边界 以 外 的 数据 、 将 一 个 对 象 
转型 为 它 并 未 实现 的 类 型 、 跳 转 到 不 存在 的 代码 行 之 类 的 事情 ， 如 果 这 
样 做 了 ， 编 译 器 将 拒绝 编译 。 但 前 面 已 经 说 过 ，Class 文 件 并 不 一 定 要 求 
用 Java 源 码 编译 而 来 ， 可 以 使 用 任何 途径 产生 ， 甚 至 包括 用 十 六 进 制 编 
辑 需 直接 编写 来 产生 Class 文 件 。 在 字 节 码 语言 层面 上 上， 上述 Java 代 码 无 
法 做 到 的 事情 都 是 可 以 实现 的 ， 至 少 语义 上 有 是 可 以 表达 出 来 的 。 虚 拟 机 
如 打 不 检查 输入 的 字 节 流 ， 对 其 完全 信任 的 话 ， 很 可 能 会 因为 载 入 了 有 
害 的 字 贡 流 而 导致 系统 骨 涡 ， 所 以 验证 是 虚拟 机 对 目 身 保护 的 一 项 重要 
工作 。 

















验证 阶段 是 非常 重要 的 ， 这 个 阶段 是 否 严 说， 直接 决 定 了 Java 虚 拟 
机 是 售 能 承受 恶意 代码 的 攻击 ， 从 执行 性 能 的 角度 上 讲 ， 验 证 阶段 的 工 
作 量 在 虚拟 机 的 类 加 载 子 系统 中 义 占 了 相当 大 的 一 部 分 。《Java 虚 拟 机 
规范 《第 2 版 ) 》 对 这 个 阶段 的 限制 、 指 导 还 是 比较 党 统 的 ， 规 范 中 列 


举 了 一 些 Class 文 件 格式 中 的 静态 和 结构 化 约束 ， 如 果 验 证 到 输入 的 字 节 
流 不 符合 Class 文 件 格式 的 约束 ， 虚 拟 机 就 应 抛 出 一 个 
java.lang.VerifyError 噶 第 或 其 子 类 异常 ， 但 具体 应 当 检 查 哪 些 方面 ， 如 
何 检查 ， 何 时 检查 ， 都 没有 足够 具体 的 要 求 和 明确 的 说 明 。 直 到 2011 年 
发 布 的 《Java 虚 拟 机 规范 (Java SE 7 版 ) 》， 大 幅 增加 了 描述 验证 过 程 
的 篇 幅 〈 从 不 到 10 页 增加 到 130 页 ) ， 这 时 约束 和 验证 规则 才 变 得 具体 
起 来 。 受 篇 幅 所 限 ， 本 书 无 法 逐条 规则 去 讲解 ， 但 从 整体 上 看 ， 验 证 阶 
段 大 致 上 会 完成 下 面 4 个 阶段 的 检验 动作 : 文件 格式 验证 、 元 数据 验 
证 、 字 节 码 验证 、 符 号 引用 验证 。 














1. 文 件 格式 验证 


第 一 阶段 要 验证 字 节 流 是 否 符合 Class 文 件 格式 的 规范 ， 并 且 能 被 当 
前 版 本 的 虚拟 机 处 理 。 这 一 阶段 可 能 包括 下 面 这 些 验证 点 : 


是 否 以 魔 数 0xCAFEBABE 开 头 。 








主 、 次 版 本 号 是 否 在 当前 虚拟 机 处 理 范 围 之 内 。 














第 量 池 的 种 量 中 是 否 有 不 被 文 持 的 种 和 量 类 型 〈 检 查 常 量 tag 标 


站 ) 


AN 








指 癌 常量 的 各 种 索引 值 中 是 否 有 指向 不 存在 的 常量 或 不 符合 类 型 的 








tn 


第 


O 














CONSTANT _Utf8_info 型 的 常量 中 是 否 有 不 符合 UTF8 编 码 的 数据 。 








Class 文 件 中 各 个 部 分 及 文件 本 里 是 否 有 被 删除 的 或 附加 的 其 他 信 


亚 


实际 上 ， 第 一 阶段 的 验证 点 还 远 不 止 这 些 ， 上 面 这 些 只 是 从 
HotSpot 虚 拟 机 源码 趾 中 摘抄 的 一 小 部 分 内 容 ， 该 验证 阶段 的 主要 目的 
古 保 证 输入 的 字 节 流 能 正确 地 解析 并 存储 于 方法 区 之 内 ， 格 式 上 符合 描 
述 一 个 Java 类 型 信息 的 要 求 。 这 阶段 的 验证 是 基于 二 进 制 字 节 流 进行 
的 ， 只 有 通过 了 这 个 阶段 的 验证 后 ， 字 市 流 才 会 进入 内 存 的 方法 区 中 进 
行 存储 ， 所 以 后 面 的 3 个 验证 阶段 全 部 是 基于 方法 区 的 存储 结构 进行 
的 ， 不 会 再 直接 操作 字 节 流 。 





2. 元 数据 验证 


第 二 阶段 是 对 字 节 码 描述 的 信息 进行 语义 分 析 ， 以 保证 其 描述 的 信 


恩 符 合 Java 语 言 规范 的 要 求 ， 这 个 阶段 可 能 包括 的 验证 点 如 下 : 





这 个 类 是 否 有 父 类 (除了 java.lang.Object 之 外 ， 所 有 的 类 都 应 当 有 


父 类 ) 











这 个 类 的 父 类 是 人 否 继承 了 不 允许 被 继承 的 类 《被 final 修 饰 的 类 ) 。 


如 果 这 个 类 不 是 抽象 类 ， 是 否 实现 了 其 父 类 或 接口 之 中 要 求实 现 的 
所 有 方法 。 


类 中 的 字段 、 方 法 是 否 与 父 类 产生 矛盾 〈 例 如 覆盖 了 父 类 的 final 字 
段 ， 或 者 出 现 不 符合 规则 的 方法 重 载 ， 例 如 方法 参数 都 一 致 ， 但 返回 值 
类 型 却 不 同等 ) 。 


第 二 阶段 的 主要 目的 是 对 类 的 元 数据 信息 进行 语义 校 验 ， 保 证 不 存 


在 不 符合 Java 语 言 规范 的 元 数据 信息 。 


3. 字 节 码 验证 


第 三 阶段 是 整个 验证 过 程 中 最 复杂 的 一 个 阶段 ， 主 要 目的 是 通过 数 
气流 和 控制 流 分 析 ， 确 定 程 序 语义 是 合法 的 、 符 合 逻 辑 的 。 在 第 二 阶段 
对 元 数据 信息 中 的 数据 类 型 做 完 校 验 后 ， 这 个 阶段 将 对 类 的 方法 体 进 行 
校 验 分 析 ， 保 证 被 校 验 类 的 方法 在 运行 时 不 会 做 出 危害 虚拟 机 安全 的 事 
件 ， 例 如 : 








保证 任意 时 刻 操 作 数 栈 的 数据 类 型 与 指令 代码 序列 都 能 配合 工作 ， 
例如 不 会 出 现 类 似 这 样 的 情况 ， 在 操作 栈 放 置 了 一 个 int 类 型 的 数据 ， 使 
用 时 却 按 long 类 型 来 加 载 入 本 地 变量 表 中 。 


保证 跳 转 指令 不 会 跳 转 到 方法 体 以 外 的 字 节 码 指 令 上 。 


保证 方法 体 中 的 类 型 转换 是 有 效 的， 例如 可 以 把 一 个 子 类 对 象 赋值 
给 父 类 数据 类 型 ， 这 是 安全 的 ， 但 是 把 父 类 对 象 赋值 给 子 类 数据 类 型 ， 
甚至 把 对 象 赋值 给 与 它 室 无 继承 关系 、 完 全 不 相干 的 一 个 数据 类 型 ， 则 
是 危险 和 不 合法 的 。 








如 果 一 个 类 方法 体 的 字 节 码 没 有 通过 字 市 码 验证 ， 那 肯定 是 有 问题 
的 ;但 如 果 一 个 方法 体 通 过 了 字 市 码 验证 ， 也 不 能 说 明 其 一 定 束 是 安全 
的 。 即 使 字 市 码 验证 之 中 进行 了 大 量 的 检查 ， 也 不 能 保证 这 一 点 。 这 里 
涉及 了 离散 数学 中 一 个 很 著名 的 问题 "Halting Problem" 通俗 一 点 的 
说 法 就 是 ， 通 过 程序 去 校 验 程序 逻辑 是 无 法 做 到 绝对 准确 的 一 一 不 能 通 
过 程序 准确 地 检查 出 程序 是 否 能 在 有 限 的 时 间 之 内 结束 运行 。 








由 于 数据 流 验 证 的 高 复杂 性 ， 虚 拟 机 设计 团队 为 了 避免 过 多 的 时 间 
消耗 在 字 节 码 验 证 阶段 ， 在 JDK 1.6 之 后 的 Javac 编 译 器 和 Java 虚 拟 机 中 
进行 了 一 项 优化 ， 给 方法 体 的 Code 属 性 的 属性 表 中 增加 了 一 项 名 
为 "StackMapTable" 的 属性 ， 这 项 属性 描述 了 方法 体 中 所 有 的 基本 块 
(Basic Block， 按 照 控 制 流 拆 分 的 代码 块 〉 开 始 时 本 地 变量 表 和 操作 栈 
应 有 的 状态 ， 在 字 节 码 验 证 期 间 ， 就 不 需要 根据 程序 推导 这 些 状 态 的 合 
法 性 ， 只 需要 检查 StackMapTable 属 性 中 的 记录 是 否 合法 即 可 。 这 样 将 
字 厄 人 码 验证 的 类 型 推导 转变 为 类 型 检查 从 而 节省 一 些 时 间 。 








理论 上 StackMapTable 属 性 也 存在 错误 或 被 算 改 的 可 能 ， 所 以 是 否 
有 可 能 在 恶意 自 改 了 Code 属 性 的 同时 ， 也 生成 相应 的 StackMapTable 属 
性 来 骗 过 虚拟 机 的 类 型 校 验 则 是 虚拟 机 设计 者 值得 思考 的 问题 。 


在 JDK 1.6 的 HotSpot 虚 拟 机 中 提供 了 -XX:-UseSplitVerifier 选 项 来 关 
闭 这 项 优化 ， 或 者 使 用 参数 -XX:+FailOverToOldVerifier 要 求 在 类 型 校 验 
失败 的 时 候 退 回 到 旧 的 类 型 推导 方式 进行 校 验 。 而 在 JDK 1.7 之 后 ， 对 
于 主 版 本 号 大 于 50 的 Class 文 件 ， 使 用 类 型 检查 来 完成 数据 流 分 析 校 验 则 
是 唯一 的 选择 ， 不 允许 再 退回 到 类 型 推导 的 校 验方 式 。 








4. 符 号 引用 验证 


最 后 一 个 阶段 的 校 验 发 生 在 虚拟 机 将 符号 引用 转化 为 直接 引用 的 时 
候 ， 这 个 转化 动作 将 在 连接 的 第 三 阶段 一 一 解析 阶段 中 发 生 。 符 号 引用 
验证 可 以 看 做 是 对 类 自身 以 外 常量 池 中 的 各 种 符号 引用 〉 的 信息 进行 
匹配 性 校 验 ， 通 音 需 要 校 验 下 列 内 容 : 


守 写 引用 中 通过 字符 串 描述 的 全 限定 名 是 否 能 找到 对 应 的 类 。 


sx: 
慌 





在 指定 类 中 是 人 否 存在 符合 方法 的 字段 描述 符 以 及 简单 名 称 所 描述 的 
方法 和 字段 。 


符号 引用 中 的 类 、 字 段 、 方 法 的 访问 性 (private、protected、 
public、default) 是否 可 被 当前 类 访问 。 


符号 引用 验证 的 目的 是 确保 解析 动作 能 正 第 执行 ， 如 果 无 法 通过 符 
号 引用 验证 ， 那 么 将 会 抛 出 一 个 java.lang.IncompatibleClassChangeError 
异常 的 子 类 ， 如 java.lang.IllegalAccessError、 


java.lang.NoSuchFieldError、java.lang.NoSuchMethodError 等 。 


对 于 虚拟 机 的 类 加 载 机 制 来 说 ， 验 证 阶段 是 一 个 非常 重要 的 、 但 不 
征 一 定 必 要 《〈 因 为 对 程序 运行 期 没有 影响 ) 的 阶段 。 如 果 所 运行 的 全 部 
代码 (包括 自己 编写 的 及 第 三 方 包 中 的 代码 ) 痢 已 经 被 反复 使 用 和 验证 
过 ， 那 么 在 实施 阶段 束 可 以 考虑 使 用 -Xverify:none 参 数 来 关闭 大 部 分 的 
类 验证 措施 ， 以 缩短 虚拟 机 类 加 载 的 时 间 。 





四 源码 位 置 : hotspot\src\share\vm\classfile\classFileParser.cpp。 

D] 停 机 问题 就 是 判断 任意 一 个 程序 是 否 会 在 有 限 的 时 间 之 内 结束 运行 的 
问题 。 如 果 这 个 问题 可 以 在 有 限 的 时 间 之 内 解决 ， 可 以 有 一 个 程序 判断 
其 本 身 是 否 会 停机 并 做 出 相反 的 行为 。 这 时 候 显然 不 管 停机 问题 的 结果 
是 什么 都 不 会 符合 要 求 ， 所 以 这 是 一 个 不 可 解 的 问题 。 具 体 的 证 明 过 程 
可 参考 : http://zh.wikipedia.org/zh/ 停 机 问题 。 


7.3.3 ”准备 








准备 阶段 是 正式 为 类 变量 分 配 内 存 并 设置 类 变量 初始 值 的 阶段 ， 这 
些 变量 所 使 用 的 内 存 都 将 在 方法 区 中 进行 分 配 。 这 个 阶段 中 有 两 个 容易 
产生 混淆 的 概念 需要 强调 一 下 ， 首 先 ， 这 时 候 进 行内 存 分 配 的 仅 包 括 类 
变量 (被 static 修 饰 的 变量 ) ， 而 不 包括 实例 变量 ， 实 例 变 量 将 会 在 对 象 
实例 化 时 随 着 对 象 一 起 分 配 在 Java 堆 中 。 其 次 ， 这 里 所 说 的 初始 值 “ 通 
常情 况 * 下 是 数据 类 型 的 零 值 ， 假 设 一 个 类 变量 的 定义 为 : 














public static int value=123; 


那 变量 value 在 准备 阶段 过 后 的 初始 值 为 0 而 不 是 123， 因 为 这 时 候 疝 
未 开始 执行 任何 Java 方 法 ， 而 把 value 赋 值 为 123 的 putstatic 指 令 是 程序 被 
编译 后 ， 存 放 于 类 构造 器 二 clinit>() 方 法 之 中 ， 所 以 把 value 赋 值 为 123 
的 动作 将 在 初始 化 阶段 才 会 执行 。 表 7-1 列 出 了 Java 中 所 有 基本 数据 类 型 
的 零 值 。 


表 7-1 基本 数据 类 型 的 零 值 

















数据 类 型 数据 类 型 零 值 
int boolean fals 
long float 0.0f 
short (Shortb 0 double 0.0d 
char '\u0000" reference null 
byte (byte) 0 











上 面 提 到 ， 在 “ 通 音 情况 ?下 初始 值 是 零 值 ， 那 相对 的 会 有 一 些 “ 特 
殊 情 况 ”: 如 条 类 字段 的 字段 属性 表 中 存在 ConstantValue 属 性 ， 那 在 准 
备 阶 段 变 量 value 就 会 被 初始 化 为 ConstantValue 属 性 所 指定 的 值 ， 假 设 上 
面 类 变量 value 的 定义 变 为 : 


public static 








final int value=123; 


编译 时 Javac 将 会 为 value 生 成 ConstantValue 属 性 ， 在 准备 阶段 虚拟 
机 就 会 根据 ConstantValue 的 设置 将 value 赋 值 为 123。 


7.3.4 ”解析 


解析 阶段 是 虚拟 机 将 常量 池内 的 符号 引用 车 换 为 直接 引用 的 过 程 ， 
符号 引用 在 前 一 章 讲 解 Class 文 件 格式 的 时 候 已 经 出 现 过 多 次 ， 在 Class 
文件 中 它 以 CONSTANT _Class_info、CONSTANT Fieldref info、 
CONSTANT_Methodref_info 等 类 型 的 常量 出 现 ， 那 解析 阶段 中 所 说 的 直 
接 引 用 与 符号 引用 又 有 什么 关联 呢 ? 


符号 引用 〈Symbolic References) : 符号 引用 以 一 组 符号 来 描述 所 
引用 的 目标 ， 符 号 可 以 是 任何 形式 的 字面 量 ， 只 要 使 用 时 能 无 发 义 地 定 
位 到 目标 即 可 。 符 号 引用 与 虚拟 机 实现 的 内 存 布局 无 天 ， 引 用 的 目标 并 
不 一 定 已 经 加 载 到 内 存 中 。 各 种 虚拟 机 实现 的 内 存 布局 可 以 各 不 相同 ， 
但 是 它们 能 接受 的 符号 引用 必须 都 是 一 致 的 ， 因 为 符号 引用 的 字面 量 形 
式 明 确定 义 在 Java 虚 拟 机 规范 的 Class 文 件 格式 中 。 











直接 引用 (Direct References) : 直接 引用 可 以 是 直接 指向 目标 的 指 
针 、 相 对 偏 移 量 或 是 一 个 能 间接 定位 到 目标 的 句柄 。 直 接 引 用 是 和 虚拟 
机 实现 的 内 存 布局 相关 的 ， 同 一 个 符号 引用 在 不 同 虚拟 机 实例 上 翻译 出 
来 的 直接 引用 一 般 不 会 相同 。 如 果 有 了 直接 引用 ， 那 引用 的 目标 必定 已 
经 在 内 存 中 存在 。 




















虚拟 机 规范 之 中 并 未 规定 解析 阶段 发 生 的 具体 时 间 ， 只 要 求 了 在 执 


行 anewarray、checkcast、getfield、getstatic、instanceof、 
invokedynamic、invokeinterface、invokespecial、invokestatic、 
invokevirtual、ldc、l]dc_ w、multianewarray、new、putfield 和 putstatic 这 
16 个 用 于 操作 符 写 引用 的 字 市 码 指 令 之 前 ， 先 对 它们 所 使 用 的 符 写 引用 
进行 解析 。 所 以 虚拟 机 实现 可 以 根据 需要 来 判断 到 底 是 在 类 被 加 载 旨 加 
载 时 就 对 常量 池 中 的 符号 引用 进行 解析 ， 还 是 等 到 一 个 符号 引用 将 要 被 
使 用 前 才 去 解析 它 。 














对 同一 个 符号 引用 进行 多 次 解析 请 求 是 很 常见 的 事情 ， 除 
invokedynamic 指 令 以 外 ， 虚 拟 机 实现 可 以 对 第 一 次 解析 的 结果 进行 缓存 
《在 运行 时 币 量 池 中 记录 直接 引用 ， 并 把 种 量 标识 为 已 解析 状态 ) 从 而 
避免 解析 动作 重复 进行 。 无 论 是 否 真正 执行 了 多 次 解析 动作 ， 虚 拟 机 需 
要 保证 的 是 在 同一 个 实体 中 ， 如 果 一 个 符号 引用 之 前 已 经 被 成 功 解析 
过 ， 那 么 后 续 的 引用 解析 请 求 束 应 当 一 直 成 功 ， 同样 的 ， 如 果 人 第 一 次 解 
析 失 败 了 ， 那 么 其 他 指令 对 这 个 符号 的 解析 请 求 也 应 该 收 到 相同 的 异 


Nr 


吊 。 











对 于 invokedynamic 指 令 ， 上 耐 规则 则 不 成 立 。 当 人 页 到 某 个 前 面 已 经 
由 invokedynamic 指 令 触 发 过 解析 的 符号 引用 时 ， 并 不 意味 着 这 个 解析 结 
果 对 于 其 他 invokedynamic 指 令 也 同样 生效 。 因 为 invokedynamic 指 令 的 
目的 本 来 就 是 用 于 动态 语言 广 持 (目前 仅 使 用 Java 语 言 不 会 生成 这 条 字 
市 乌 指令 ) ， 它 所 对 应 的 引用 称 为 “动态 调用 点 限定 符 ”(Dynamic Call 





Site Specifier) ， 这 里 “动态 ”的 含义 就 是 必须 等 到 程序 实际 运行 到 这 条 
指令 的 时 候 ， 解 析 动 作 才能 进行 。 相 对 的 ， 其 余 可 触发 解析 的 指令 都 

征 “ 静 态 ” 的 ， 可 以 在 刚刚 完成 加 载 阶段 ， 还 没有 开始 执行 代码 时 惑 进行 
解析 。 











解析 动作 主要 针对 类 或 接口 、 字 段 、 类 方法 、 接 口 方法 、 方 法 类 
型 、 方 法 句柄 和 调用 点 限定 符 7 类 符号 引用 进行 ， 分别 对 应 于 常量 池 的 
CONSTANT_Class _info、 CONSTANT_ Fieldref_info、 








CONSTANT Methodref info、 CONSTANT_ InterfaceMethodref_info、 
CONSTANT_MethodType_info、CONSTANT_MethodHandle_ info 和 
CONSTANT_InvokeDynamic_info 7 种 常量 类 型 中 。 下 面 将 讲解 前 面 4 种 
引用 的 解析 过 程 ， 对 于 后 面 3 种 ， 与 JDK 1.7 新 增 的 动态 语言 文 持 恩 轧 相 
天， 由 于 Java 语 言 是 一 门 静 态 类 型 语言 ， 因 此 在 没有 介绍 invokedynamic 
指令 的 语义 之 前 ， 没 有 办 法 将 它们 和 现在 的 Java 语 言 对 应 上 ， 笔 者 将 在 


第 8 草 介 绍 动态 语言 调用 时 一 起 分 析 讲 解 。 





1. 类 或 接口 的 解析 


假设 当前 代码 所 处 的 类 为 D， 如 果 要 把 一 个 从 未 解析 过 的 符号 引用 
N 解 析 为 一 个 类 或 接口 C 的 直接 引用 ， 那 虚拟 机 完成 整个 解析 的 过 程 需 
要 以 下 3 个 步 又 : 








1) 如 果 C 不 是 一 个 数组 类 型 ， 那 虚拟 机 将 会 把 代表 N 的 全 限定 名 传 





递 给 D 的 类 加 载 器 去 加 载 这 个 类 C。 在 加 载 过 程 中 ， 由 于 元 数据 验证 、 
字 节 码 验 证 的 需要 ， 又 可 能 触发 其 他 相关 类 的 加 载 动 作 ， 例 如 加 载 这 个 
类 的 父 类 或 实现 的 接口 。 一 旦 这 个 加 载 过 程 出 现 了 任何 异常 ， 解 析 过 程 
就 宣告 失败 。 








2) 如 果 C 是 一 个 数组 类 型 ， 并 且 数 组 的 元 素 类 型 为 对 象 ， 也 就 是 N 
的 描述 符 会 是 类 似 "[Ljavalang/Integer" 的 形式 ， 那 将 会 按照 第 1 点 的 规则 
加 载 数 组 元 素 类 型 。 如 果 N 的 描述 符 如 前 面 所 假设 的 形式 ， 需 要 加 载 的 
元 素 类 型 就 是 "java.lang.Integer"， 接 着 由 虚拟 机 生成 一 个 代表 此 数组 维 
度 和 元 素 的 数组 对 象 。 


3) 如 果 上 面 的 步 又 没有 出 现任 何 有 异常， 那么 C 在 虚拟 机 中 实际 上 已 
经 成 为 一 个 有 效 的 类 或 接口 了 ， 但 在 解析 完成 之 前 还 要 进行 符号 引用 验 
证 ， 确 认 D 是 否 具备 对 C 的 访问 权限 。 如 果 发 现 不 具备 访问 权限 ， 将 抛 


出 java.lang.IllegalAccessError 异 销 。 





2. 字 段 解析 


要 解析 一 个 未 被 解析 过 的 字段 符号 引用 ， 首 先 将 会 对 字段 表 内 
class_indexl”| 项 中 索引 的 CONSTANT_Class_info 符 号 引用 进行 解析 ， 也 
就 是 字段 所 属 的 类 或 接口 的 符号 引用 。 如 果 在 解析 这 个 类 或 接口 符号 引 
用 的 过 程 中 出 现 了 任何 异常 ， 都 会 导致 字段 符号 引用 解析 的 失败 。 如 果 
解析 成 功 完成 ， 那 将 这 个 字段 所 属 的 类 或 接口 用 C 表 示 ， 虚 拟 机 规范 要 











求 按照 如 下 步骤 对 C 进 行 后 续 字 段 的 搜索 。 


1) 如 果 C 本 吴 就 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字 
段 ， 则 返回 这 个 字段 的 直接 引用 ， 碍 找 结束 。 


2) 人 否则， 如果 在 C 中 实现 了 接口 ， 将 会 按照 继承 关系 从 下 往 上 递归 
搜索 各 个 接口 和 它 的 父 接口 ， 如 果 接 口中 包含 了 简单 名 称 和 字段 描述 符 
都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 查 找 结 





3) 否则 ， 如 果 C 不 是 java.lang.Object 的 话 ， 将 会 按照 继承 关系 从 下 
往 上 递归 搜索 其 父 类 ， 如 果 在 父 类 中 包含 了 简单 名 称 和 字段 摘 述 符 都 与 
目标 相 匹配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 碍 找 结束 。 


4) 否则 ， 查 找 失 败 ， 抛 出 java.lang.NoSuchFieldError 异 常 。 


如 果 查 找 过 程 成 功 返 回 了 引用 ， 将 会 对 这 个 字段 进行 权限 验证 ， 如 
果 发 现 不 具备 对 字段 的 访问 权限 ， 将 抛 出 java.lang.HlegalAccessError 异 


i 


中 。 





在 实际 应 用 中 ， 虚 拟 机 的 编译 器 实现 可 能 会 比 上 述 规范 要 求 得 更 加 
严格 一 些 ， 如 果 有 一 个 同名 字段 同时 出 现在 C 的 接口 和 父 类 中 ， 或 者 同 
时 在 自己 或 父 类 的 多 个 接口 中 出 现 ， 那 编译 器 将 可 能 拒绝 编译 。 在 代码 
清单 7-4 中 ， 如 果 注 释 了 Sub 类 中 的 "public static int A=4; "， 接 口 与 父 类 
同时 存在 字段 A， 那 编译 器 将 提示 "The field Sub.A is ambiguous"， 并 且 








拒绝 编译 这 段 代码 。 


代码 清单 7-4 字段 解析 











package org.fenixsoft.classloading; 
public class FieldResolutiont{ 














interface 











Interface0t{ 





int A=0; 


} 
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Interfacel extends Interface0t{ 








int A=1; 


} 
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Interface2t{ 








int A=2; 
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tatic class Parent implements Interfacelt 











ublic static int A=3; 


class Sub extends Parent implements Interface21{ 
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tic int A=4; 








ta 
ut 





tic void main (String[]args) { 
.println (Sub.A) ; 





3. 类 方法 解析 


类 方法 解析 的 第 一 个 步骤 与 字段 解析 一 样 ， 也 需要 先 解 析出 类 方法 
表 的 class_index 项 中 索引 的 方法 所 属 的 类 或 接口 的 符号 引用 ， 如 果 解 
析 成 功 ， 我 们 依然 用 C 表 示 这 个 类 ， 接 下 来 虚拟 机 将 会 按照 如 下 步骤 进 
行 后 续 的 类 方法 搜索 。 








1) 类 方法 和 接口 方法 符 写 引用 的 常量 类 型 定义 是 分 开 的 ， 如 果 在 


类 方法 表 中 发 现 class_index 中 索引 的 C 是 个 接口 ， 那 就 直接 抛 出 


java.lang.IncompatibleClassChangeError 异 和 常 。 





2) 如 果 通 过 了 第 1 步 ， 在 类 C 中 查找 是 否 有 简单 名 称 和 描述 符 痢 与 
目标 相 匹 配 的 方法 ， 如 条 有 则 返回 这 个 方法 的 直接 引用 ， 碍 找 结束 。 








3) 人 否则， 在 类 C 的 父 关 中 递归 碍 找 是 否 有 简单 名 称 和 描述 符 都 与 目 
标 相 匹配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 查 找 结 





4) 否则 ， 在 类 C 实 现 的 接口 列表 及 它们 的 父 接口 之 中 递归 查找 是 否 
有 人 简单 名 称 和 擅 述 符 都 与 目标 相 匹 配 的 方法 ， 如 果 存 在 匹配 的 方法 ， 说 
明 类 C 是 一 个 抽象 类 ， 这 时 查找 结束 ， 抛 出 java.lang.AbstractMethodError 


异 第 。 
5) 否则， 宣告 方法 查找 失败 ， 抛 出 java.lang.NoSuchMethodError。 


最 后 ， 如 果 查 找 过 程 成 功 返 回 了 直接 引用 ， 将 会 对 这 个 方法 进行 权 
限 验证 ， 如 果 发 现 不 具备 对 此 方法 的 访问 权限 ， 将 抛 出 


java.lang.IllegalAccessError 异 和 常 。 
4. 接 口 方法 解析 


接口 方法 也 需要 先 解 析出 接口 方法 表 的 class_indexI4 项 中 索引 的 方 
法 所 属 的 类 或 接口 的 符号 引用 ， 如 果 解 析 成 功 ， 依 然 用 C 表 示 这 个 接 
口 ， 接 下 来 虚拟 机 将 会 按照 如 下 步骤 进行 后 续 的 接口 方法 搜索 。 





1) 与 类 方法 解析 不 同 ， 如 果 在 接口 方法 表 中 发 现 class_index 中 的 索 
引 C 是 个 类 而 不 是 接口 ， 那 就 直接 抛 出 


java.lang.IncompatibleClassChangeError 异 和 常 。 





2) 人 否则， 在 接口 C 中 碍 找 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹配 
的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 碍 找 结 


3) 否则 ， 在 接口 C 的 父 接 口中 递归 得 找 ， 直 到 java.lang.Object 类 
《得 找 范 围 会 包括 Object 类 ) 为 止 ， 看 是 否 有 简单 名 称 和 描述 符 都 与 目 
标 相 [ 匹 配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 但 找 结束 。 


4) 人 否则， 宣告 方法 得 找 失 败 ， 抛 出 java.lang.NoSuchMethodError 异 


Ac 
串 。 


由 于 接口 中 的 所 有 方法 默认 都 是 public 的 ， 所 以 不 存在 访问 权限 的 
问题 ， 因 此 接口 方法 的 符号 解析 应 当 不 会 抛 出 


java.lang.lllegalAccessError 异 第 。 


[1 严格 来 说 ，CONSTANT_String_info 和 
CONSTANT_InterfaceMethodref_info 这 两 种 类 型 的 常量 也 有 解析 过 程 ， 
但 很 简单 、 直 观 ， 不 再 做 单独 介绍 。 

四] 参见 第 6 章 中 关于 CONSTANT_Fieldref _ info 常量 的 内 容 。 

D] 参 见 第 6 章 关 于 CONSTANT_Methodtref info 常 量 的 内 容 。 


[由 参见 第 6 章 中 关于 CONSTANT _InterfaceMethodref info 常 量 的 内 容 。 


7.3.5 ”初始 化 





类 初始 化 阶段 是 类 加 载 过 程 的 最 后 一 步 ， 前 面 的 类 加 载 过 程 中 ， 除 
了 在 加 载 阶段 用 户 应 用 程序 可 以 通过 目 定 义 类 加 载 器 参与 之 外 ， 其 余 动 
作 完 全 由 虚拟 机 主导 和 控制 。 到 了 初始 化 阶段 ， 才 真正 开始 执行 类 中 定 
义 的 Java 程 序 代码 (或 者 说 是 字 节 码 ) 。 


在 准备 阶段 ， 变 量 已 经 赋 过 一 次 系统 要 求 的 初始 值 ， 而 在 初始 化 阶 
段 ， 则 根据 程序 员 通 过 程序 制定 的 主观 计划 去 初始 化 类 变量 和 其 他 资 
源 ， 或 者 可 以 从 另外 一 个 角度 来 表达 : 初始 化 阶段 是 执行 类 构造 器 去 
clinit>() 方 法 的 过 程 。 我 们 在 下 文 会 讲解 <<clinit>() 方 法 是 怎么 生成 
的 ， 在 这 里 ， 我 们 先 看 一 下 <clinit> () 方 法 执行 过 程 中 一 些 可 能 会 影响 
程序 运行 行为 的 特点 和 细节 ， 这 部 分 相对 更 贴近 于 普通 的 程序 开发 人 


员 匡 。 











<clinit>() 方 法 是 由 编译 喜 目 动 收集 类 中 的 所 有 类 变量 的 赋值 动作 
和 静态 语句 块 《static{} 块 ) 中 的 语句 合并 产生 的 ， 编 译 需 收集 的 顺序 是 
由 语句 在 源 文件 中 出 现 的 顺序 所 决定 的 ， 静 态 语 句 块 中 只 能 访问 到 定义 
在 静态 语句 块 之 前 的 变量 ， 定 义 在 它 之 后 的 变量 ， 在 前 面 的 静态 语句 块 
可 以 赋值 ， 但 是 不 能 访问 ， 如 代码 清单 7-5 中 的 例子 所 示 。 














代码 清单 7-5 ”非法 向 前 引用 变量 





public class Test{ 

Statiert 

i=0; // 给 变量 赋值 可 以 正常 编译 通过 

System.out .print (i) ; // 这 人 句 编 译 占 会 提示 "非法 向 前 引用 " 
} 
static int i=1; 


} 


















































二 dlinit0 方 法 与 类 的 构造 函数 (或 者 说 实例 构造 器 二 init 二 0 方 
法 ) 不 同 ， 它 不 需要 显 式 地 调用 父 类 构造 器 ， 虚 拟 机 会 保证 在 子 类 的 去 
clinit>() 方 法 执行 之 前 ， 父 类 的 <clinit> (0) 方 法 已 经 执行 完毕 。 因 此 在 
虚拟 机 中 第 一 个 被 执行 的 二 dlinit 二 0 方法 的 类 肯定 是 java.lang.Object。 


由 于 父 类 的 clinit>() 方 法 先 执行 ， 也 就 意味 着 父 类 中 定义 的 静态 
语句 块 要 优先 于 子 类 的 变量 赋值 操作 ， 如 在 代码 清单 7-6 中 ， 字 上 段 B 的 值 


将 会 是 2 而 不 是 1。 


代码 清单 7-6 二 dlinit 二 0 方法 执行 顺序 








static class Parent{ 

Publie statlie Lnt A=1s 
statict 
A 
} 
} 











static class Sub extends Parent{ 
public static int B=A; 

















public static void main (String[]args) 1 
System.out.println (Sub.B) ; 

















<clinit> (0) 方 法 对 于 类 或 接口 来 说 并 不 是 必需 的 ， 如 果 一 个 类 中 没 


有 静态 语句 块 ， 也 没有 对 变量 的 赋值 操作 ， 那 么 编译 器 可 以 不 为 这 个 类 
生成 二 dlinit 二 0 方法 。 


接口 中 不 能 使 用 静态 语句 块 ， 但 仍然 有 变量 初始 化 的 赋值 操作 ， 因 
此 接口 与 类 一 样 都 会 生成 <<clinit>() 方 法 。 但 接口 与 类 不 同 的 是 ， 执 行 
接口 的 <clinit>() 方 法 不 需要 先 执 行 父 接口 的 和 clinit>() 方 法 。 只 有 当 
父 接口 中 定义 的 变量 使 用 时 ， 父 接口 才 会 初始 化 。 另 外 ， 接 口 的 实现 类 
在 初始 化 时 也 一 样 不 会 执行 接口 的 和 clinit>() 方 法 。 











虚拟 机 会 保证 一 个 类 的 <<clinit> (0) 方 法 在 多 线程 环境 中 被 正确 地 加 
锁 、 同 步 ， 如 果 多 个 线程 同时 去 初始 化 一 个 类 ， 那 么 只 会 有 一 个 线程 去 
执行 这 个 类 的 clinit> 0) 方法， 其 他 线程 都 需要 阻塞 等 待 ， 直 到 活动 线 
程 执行 二 clinit>(0 方 法 完毕 。 如 果 在 一 个 类 的 生 clinit>() 方 法 中 有 耗 时 
很 长 的 操作 ， 就 可 能 造成 多 个 进程 阻塞 i 中， 在 实际 应 用 中 这 种 阻塞 往往 
古 很 隐蔽 的 。 代 码 清单 7-7 演 示 了 这 种 场景 。 











代码 清单 7-7 字段 解析 








static class DeadLoopClassit 
statict{ 
/* 如 果 不 加 上 这 个 if 语 句 ， 编 译 器 将 提示 "Initializer does not complete 
normally" 并 拒绝 编译 */ 
if (true) { 
System.out.println (Thread.currentThread()+"init DeadLoopClass")., 
while (true) { 
} 



































} 
} 





public static void main (String[]args) 1 
Runnable script=new Runnable () { 

public void run(){ 
System.out .println (Thread.currentThread()+"start"); 
DeadLoopClass dlc=new DeadLoopClass () ; 
System.out.println (Thread.currentThread()+"run over") ; 
} 

上 

Thread threadl=new Thread (script) ; 

Thread thread2=new Thread (script) ; 

threadl .start (); 

thread2.start (); 


} 












































运行 结果 如 下 ， 即 一 条 线程 在 死 循 环 以 模拟 长 时 间 操 作 ， 男 外 一 条 
线程 在 阻塞 等 待 。 








Thread[Thread-0, 5, main]star 
Thread[Thread-1, 5, main]start 
Threadl[Thread-0, 5, main|]init DeadLoopClass 














四 这 里 只 限于 Java 语 言 编 译 产 生 的 Class 文 件 ， 并 不 包括 其 他 JVM 语 言 。 
四] 需要 注意 的 是 ， 其 他 线程 虽然 会 被 阻塞 ， 但 如 果 执 行 <clinit>0 方 法 
的 那 条 线程 退出 <clinit>0 方 法 后 ， 其 他 线程 唤醒 之 后 不 会 再 次 进入 去 


clinit>0 方 法 。 同 一 个 类 加 载 器 下 ， 一 个 类 型 只 会 初始 化 一 次 。 


7.4 ”类 加 载 器 


虚拟 机 设计 团队 把 类 加 载 阶段 中 的 “通过 一 个 类 的 全 限定 名 来 获取 
插 述 此 类 的 二 进 制 字 市 流 ” 这 个 动作 放 到 Java 虚 拟 机 外 部 去 实现 ， 以 便 
让 应 用 程序 自己 决定 如 何 去 获 取 所 需要 的 类 。 实 现 这 个 动作 的 代码 模块 
称 为 “类 加 载 器 ”。 





类 加 载 器 可 以 说 是 Java 语 言 的 一 项 创新 ， 也 是 Java 语 言 流行 的 重要 
原因 之 一 ， 它 最 初 是 为 了 满足 Java Applet 的 需求 而 开发 出 来 的 。 虽 然 目 
前 Java Applet 技 术 基本 上 已 经 “ 死 掉 ”1 ， 但 类 加 载 器 却 在 类 层次 划分 、 
OSGi、 热 部 绪 、 代 码 加 密 等 领域 大 放 寞 彩 ， 成 为 了 Java 技 术 体 系 中 一 块 
重要 的 基石 ， 可 谓 是 失 之 桑 榆 ， 收 之 东 隅 。 








7.4.1 类 与 类 加 载 器 





类 加 载 吉 虽然 只 用 于 实现 类 的 加 载 动作 ， 但 它 在 Java 程 序 中 起 到 的 
作用 却 远 远 不 限于 类 加 载 阶段 。 对 于 任意 一 个 类 ， 都 需要 由 加 载 它 的 类 
加 载 器 和 这 个 类 本 身 一 同 确 立 其 在 Java 虚 拟 机 中 的 唯一 性 ， 每 一 个 类 加 
载 句 ， 都 拥有 一 个 独立 的 类 名 称 空 间 。 这 人 句 话 可 以 表达 得 更 通俗 一 些 : 
比较 两 个 类 是 舍 “ 相 等 ”只 有 在 这 两 个 类 是 由 同一 个 类 加 载 占 加 载 的 前 


担 下 才 有 意义 ， 人 否则 ， 即 使 这 两 个 类 来 源 于 同一 个 Class 文 件 ， 被 同一 个 











虚拟 机 加 载 ， 只 要 加 载 它 们 的 类 加 载 器 不 同 ， 那 这 两 个 类 就 必定 不 相 


有 
等 。 


这 里 所 指 的 “相等 >， 包括 代表 类 的 Class 对 象 的 edquals() 方 法 、 
isAssignableFrom() 方 法 、isInstance() 方 法 的 返回 结果 ， 也 包括 使 用 
instanceof 关 键 字 做 对 象 所 属 关 系 判 定 等 情况 。 如 果 没 有 注意 到 类 加 载 器 
的 影响 ， 在 某 些 情况 下 可 能 会 产生 具有 迷惑 性 的 结果 ， 代 码 清单 7-8 中 
演示 了 不 同 的 类 加 载 器 对 instanceof 关 键 字 运算 的 结果 的 影响 。 





代码 清单 7-8 不同 的 类 加 载 器 对 instanceof 关 键 字 运算 的 结果 的 影 
啊 





/** 
* 类 加 载 器 与 instanceof 关 键 字 演示 
大 








*@Qauthor zzm 

人 

public class ClassLoaderTest{ 

public static void main (String[]args) throws Exceptiont{ 

ClassLoader myLoader=new ClassLoader(){ 

QOverride 

public Class<?>1loadClass (String name) throws 
ClassNotFoundException{ 


























tryl{ 
String fileName=name.substring (name.lastIndexOf (".") 
+1) +".class"; 
InputStream is=getClass() .getResourceAsStream (fileName). 





if (is==null) 1 

return super.loadClass (Cname) ; 
} 
byte[]jb=new bytel[is.available()|]; 
is.read (pb); 

return defineClass (name,b, 0, pb.length). 
}catch (IOException e) { 

throw new ClassNotFoundException (name) ; 





























} 

} 

上 

Object 
obj=myLoader.loadClass ("org.fenixsoft.classloading.ClassLoaderTest") 

System.out.println (obj.getClass ()); 

System.out.println (obj instanceof 
org.fenixsoft.classloading.ClassLoaderTest).; 


















































class org.fenixsoft.classloading.ClassLoaderTest 
false 











代码 清单 7-8 中 构造 了 一 个 简单 的 类 加 载 器 ， 尽 管 很 简单 ， 但 是 对 
于 这 个 演示 来 说 还 是 够 用 了 。 它 可 以 加 载 与 自己 在 同一 路 径 下 的 Class 文 
件 。 我 们 使 用 这 个 类 加 载 器 去 加 载 了 一 个 名 
为 "org.fenixsoft.classloading.ClassLoaderTest" 的 类 ， 并 实例 化 了 这 个 类 的 
对 象 。 两 行 输出 结果 中 ， 从 第 一 句 可 以 看 出 ， 这 个 对 象 确实 是 类 
org.fenixsoft.classloading.ClassLoaderTest 实 例 化 出 来 的 对 象 ， 但 从 第 二 





名 可 以 发 现 ， 这 个 对 象 与 类 org.fenixsoft.classloading.ClassLoaderTest 做 
所 属 类 型 检查 的 时 候 却 返 回 了 false， 这 是 因为 虚拟 机 中 存在 了 两 个 
ClassLoaderTest 类 ， 一 个 是 由 系统 应 用 程序 类 加 载 器 加 载 的 ， 另 外 一 个 
是 由 我 们 自 定 义 的 类 加 载 器 加 载 的 ， 虽 然 都 来 自 同 一 个 Class 文 件 ， 但 依 
然 是 两 个 独立 的 类 ， 做 对 象 所 属 类 型 检查 时 结果 自然 为 false。 





站] 特 指 浏览 器 上 的 Java Applets， 在 其 他 领域 ， 如 智能 卡 上 ，Java Applets 


仍然 有 广阔 的 市 场 。 


7.4.2 ”双亲 委派 模型 





从 Java 虚 拟 机 的 角度 来 讲 ， 只 存在 两 种 不 同 的 类 加 载 器 : 一 种 是 局 
动 类 加 载 器 (Bootstrap ClassLoader) ， 这 个 类 加 载 器 使 用 C++ 语言 实现 
趾 ， 是 虚拟 机 自身 的 一 部 分 ， 另 一 种 就 是 所 有 其 他 的 类 加 载 器 ， 这 些 类 
加 载 嚣 都 由 Java 语 言 实现 ， 独 立 于 虚拟 机 外 部 ， 并 且 全 都 继承 自 抽象 类 


java.lang.ClassLoader。 





从 Java 开 及 人 员 的 角度 来 看 ， 类 加 载 器 还 可 以 划分 得 更 细致 一 些 ， 
绝 大 部 分 Java 程 序 都 会 使 用 到 以 下 3 种 系统 提供 的 类 加 载 器 。 


启动 类 加 载 器 (Bootstrap ClassLoader) : 前 面 已 经 介绍 过 ， 这 个 类 
将 器 负责 将 存放 在 <JAVA_HOME>Nlib 目 录 中 的 ， 或 者 被 - 
Xbootclasspath 参 数 所 指定 的 路 径 中 的 ， 并 且 是 虚拟 机 识别 的 〈 仅 按照 文 
件 名 识别 ， 如 rt.jar， 名 字 不 符合 的 类 库 即 使 放 在 ib 目录 中 也 不 会 被 加 
载 ) 类 库 加 载 到 虚拟 机 内 存 中 。 局 动 类 加 载 器 无 法 被 Java 程 序 直 接 引 
用 ， 用 户 在 编写 自 定义 类 加 载 器 时 ， 如 果 需 要 把 加 载 请 求 委派 给 引导 类 
加 载 器 ， 那 直接 使 用 nul 代 替 即 可 ， 如 代码 清单 7-9 所 示 为 
java.lang.ClassLoader.getClassLoader() 方 法 的 代码 片段 。 














代码 清单 7-9 ”ClassLoader.getClassLoader() 方 法 的 代码 片段 





/** 





Returns the class loader for the class.Some implementations may 
use null to represent the bootstrap class loader.This method will 




















return null in such implementations if this class was loaded by the 
bootstrap class loader. 
*/ 


public ClassLoader getClassLoader(){ 

ClassLoader cl=getClassLoader0 () ; 

if (cl==null) 

return null; 

SecurityManager sm=System.getSecurityManager (); 

if (sm!l=null) 1 

ClassLoader ccl=ClassLoader.getCallerClassLoader () ; 
if (ccl!l=null&&ccl!l=cl& Rlcl.isAncestor (cc1) ) { 
sm.checkPermission (SecurityConstants .GET CLASSLOADER _ PERMISSION ) ; 
} 

} 

return cl; 


} 



























































扩展 类 加 载 器 (Extension ClassLoader) : 这 个 加 载 器 由 
sun.misc.Launcher $ExtClassLoader 实 现 ， 它 负责 加 载 <JAVA_HOME > 
libvext 目 录 中 的 ， 或 者 被 java.ext.dirs 系 统 变量 所 指定 的 路 径 中 的 所 有 类 
库 ， 开 发 者 可 以 直接 使 用 扩展 类 加 载 器 。 


应 用 程序 类 加 载 器 (Application ClassLoader) : 这 个 类 加 载 器 由 
sun.misc.Launcher $App-ClassLoader 实 现 。 由 于 这 个 类 加 载 器 是 
ClassLoader 中 的 getSystemClassLoader() 方 法 的 返回 值 ， 所 以 一 般 也 称 
为 系统 类 加 载 器 。 它 负责 加 载 用 户 类 路 径 (ClassPath) 上 所 指定 的 类 
库 ， 开 发 者 可 以 直接 使 用 这 个 类 加 载 器 ， 如 果 应 用 程序 中 没有 自 定 义 过 
自己 的 类 加 载 器 ， 一 般 情 况 下 这 个 就 是 程序 中 默认 的 类 加 载 器 。 











我 们 的 应 用 程序 都 是 由 这 3 种 类 加 载 器 互相 配合 进行 加 载 的 ， 如 果 


有 必要 ， 还 可 以 加 入 目 己 定义 的 类 加 载 器 。 这 些 类 加 载 器 之 间 的 关系 一 
般 如 图 7-2 所 示 。 





图 7-2 类 加 载 器 双亲 委派 模型 


图 7-2 中 展示 的 类 加 载 器 之 间 的 这 种 层次 关系 ， 称 为 类 加 载 器 的 双 
亲 委 派 模型 (Parents Delegation Model) 。 双 亲 委 派 模型 要 求 除了 顶层 
的 局 动 类 加 载 嚣 外， 其 余 的 类 加 载 器 都 应 当 有 上 自己 的 父 类 加 载 器 。 这 里 
类 加 载 器 之 间 的 父子 关系 一 般 不 会 以 继承 〈Inheritance) 的 关系 来 实 
现 ， 而 是 都 使 用 组 合 〈《Composition) 关系 来 复 用 父 加 载 器 的 代码 。 


类 加 载 器 的 双亲 委派 模型 在 JDK 1.2 期 间 被 引入 并 被 广泛 应 用 于 之 


后 几乎 所 有 的 Java 程 序 中 ， 但 它 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 
Java 设 计 者 推荐 给 开发 者 的 一 种 类 加 载 占 实现 方式 。 


双 杀 委派 模型 的 工作 过 程 是 : 如 果 一 个 类 加 载 融 收 到 了 类 加 载 的 请 
求 ， 它 首先 不 会 日 己 去 尝试 加 载 这 个 类 ， 而 是 把 这 个 请 求 委 派 给 父 类 加 
载 右 去 完成 ， 每 一 个 层次 的 类 加 载 器 都 是 如 此 ， 因 此 所 有 的 加 载 请 求 最 
终 都 应 该 传送 到 项 层 的 启动 类 加 载 器 中 ， 只 有 当 父 加 载 器 反馈 目 己 无 法 
完成 这 个 加 载 请 求 它 的 搜索 范围 中 没有 找到 所 需 的 类 )〉 时 ， 子 加 载 器 
才 会 尝试 自己 去 加 载 。 





使 用 双亲 委派 模型 来 组 织 类 加 载 器 之 间 的 关系 ， 有 一 个 显而易见 的 
好 处 就 是 Java 类 随 着 它 的 类 加 载 器 一 起 具备 了 一 种 带 有 优先 级 的 层次 关 
系 。 例 如 类 java.lang.Object， 它 存放 在 rt.jar 之 中 ， 无 论 哪 一 个 类 加 载 右 
要 加 载 这 个 类 ， 最 终 都 是 委派 给 处 于 模型 最 顶端 的 启动 类 加 载 器 进行 加 
载 ， 因 此 Object 类 在 程序 的 各 种 类 加 载 器 环境 中 都 是 同一 个 类 。 相 反 ，， 
如 果 没 有 使 用 双亲 委派 模型 ， 由 各 个 类 加 载 器 自行 去 加 载 的 话 ， 如 果 用 
户 自己 编写 了 一 个 称 为 java.lang.Object 的 类 ， 并 放 在 程序 的 ClassPath 
中 ， 那 系统 中 将 会 出 现 多 个 不 同 的 Object 类 ，Java 类 型 体系 中 最 基础 的 
行为 也 就 无 法 保证 ， 应 用 程序 也 将 会 变 得 一 片 混乱 。 如 果 读 者 有 兴趣 的 
话 ， 可 以 尝试 去 编写 一 个 与 rt.jar 类 库 中 己 有 类 重 名 的 Java 类 ， 将 会 发 现 
可 以 正常 编译 ， 但 永远 无 法 被 加 载运 行 呈 。 




















双亲 委派 模型 对 于 保证 Java 程 序 的 稳定 运作 很 重要 ,但 它 的 实现 却 


非常 简单 ， 实 现 双 亲 委 派 的 代码 都 集中 在 java.lang.ClassLoader 的 
loadClass() 方 法 之 中 ， 如 代码 清单 7-10 所 示 ， 届 辑 清晰 易 懂 : 先 检 查 是 
个 已 经 被 加 载 过 ， 若 没有 加 载 则 调用 父 加 载 器 的 loadClass(0) 方 法 ， 知 父 
加 载 器 为 空 则 默认 使 用 启动 类 加 载 器 作为 父 加 载 器 。 如 果 父 类 加 载 失 
败 ， 抛 出 ClassNotFoundException 腊 党 后， 再 调用 上 自己 的 findClass(0) 方 法 
进行 加 载 。 


代码 清单 7-10 “双色 委派 模型 的 实现 





protected synchronized Class<?>1loadClass (String name,boolean 
resolve) throws ClassNotFoundException 








{ 

// 首 先 ， 检 查 请 求 的 类 是 否 已 经 被 加 载 过 了 
Class c=findLoadedClass (Cname) ; 

if (c==null1) { 

ty 

if (parent!=null) 1 
c=parent.loadClass (namey false) ; 
}elsef{ 

c=findBootstrapClassOrNull (Cname) ; 
} 
}catch (ClassNotFoundException e) 1 

/ /如 果 父 类 加 载 器 抛 出 classNotFoundException 
// 说 明 父 类 加 载 器 无 法 完成 加 载 请 求 

} 

if (c==null1) { 

/ /在 父 类 加 载 器 无 法 加 载 的 时 候 

// 再 调用 本 身 的 findclass 方 法 来 进行 类 加 载 
c=findClass (Cname) ; 

} 

} 

if (resolve) { 

resolveClass (c) ; 

} 

EtU 人 EC 


} 


ee | 



























































[这 里 只 限于 HotSpot， 像 MRP、IMaxine 等 虚拟 机 ， 整 个 虚拟 机 本 身 都 
是 由 Java 编 写 的 ， 自 然 Bootstrap ClassLoadetr 也 是 由 Java 语 言 而 不 是 C+ 二 + 实 
现 的 。 退 一 步 讲 ， 除 了 HotSpot 以 外 的 其 他 两 个 高 性 能 虚拟 机 JRockit 和 ]9 
都 有 一 个 代表 Bootsttap ”ClassLoader 的 Java 类 存在 ， 但 是 关键 方法 的 实现 
仍然 是 使 用 JNI 回 调 到 C (注意 不 是 C++) 的 实现 上 ， 这 个 Bootstrap 
ClassLoadet 的 实例 也 无 法 被 用 户 获取 到 。 

2 即使 自 定义 了 自己 的 类 加 载 器 ， 强 行 用 defineClass0 方 法 去 加 载 一 个 

以 "java.lane" 开 头 的 类 也 不 会 成 功 。 如 果 党 试 这 样 做 的 话 ， 将 会 收 到 一 个 
由 虚拟 机 自己 抛 出 的 "java.lang.SecutrityException:Prohibited package 


name:java.lang" 异常 。 


7.4.3 ”人 破坏 双亲 委派 模型 


上 文 提 到 过 双 半 委派 模型 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 Java 
设计 者 推荐 给 开发 者 的 类 加 载 器 实现 方式 。 在 Java 的 世界 中 大 部 分 的 类 
加 载 器 都 齐 循 这 个 模型 ， 但 也 有 例外 ， 到 目前 为 止 ， 双 杀 委 派 模型 主要 
出 现 过 3 较 大 规模 的 “被 破坏 ”情况 。 








双亲 委派 模型 的 第 一 次 “被 破坏 ”其 实 发 生 在 双亲 委派 模型 出 现 之 前 
一 一 即 JDK 1.2 发 布 之 前 。 由 于 双亲 委派 模型 在 JDK 1.2 之 后 才 被 引入 ， 
而 类 加 载 器 和 抽象 类 java.lang.ClassLoader 则 在 JDK 1.0 时 代 就 已 经 存 
在 ， 面 对 已 经 存在 的 用 户 自 定义 类 加 载 器 的 实现 代码 ，Java 设 计 者 引入 
双亲 委派 模型 时 不 得 不 做 出 一 些 妥协 。 为 了 向 前 兼容 ，JDK 1.2 之 后 的 
java.lang.ClassLoader 添 加 了 一 个 新 的 protected 方 法 findClass0， 在 此 之 
前 ， 用 户 去 继承 java.lang.ClassLoader 的 唯一 目的 就 是 为 了 重 写 
loadClass() 方 法 ， 因 为 虚拟 机 在 进行 类 加 载 的 时 候 会 调用 加 载 器 的 私有 
方法 loadClassInternal0， 而 这 个 方法 的 唯一 逻辑 就 是 去 调用 自己 的 
loadClass()。 








上 一 节 我 们 已 经 看 过 loadClass() 方 法 的 代码 ， 双 亲 委 派 的 具体 逻辑 
就 实现 在 这 个 方法 之 中 ，JDK 1.2 之 后 已 不 提倡 用 户 再 去 覆盖 loadClass(0) 
方法 ， 而 应 当 把 自己 的 类 加 载 逻 辑 写 到 findClass() 方 法 中 ， 在 loadClass() 














方法 的 逻辑 里 如 果 父 类 加 载 失 败 ， 则 会 调用 自己 的 fndClass0) 方 法 来 完 
成 加 载 ， 这 样 束 可 以 保证 新 写 出 来 的 类 加 载 绅 是 符合 双亲 委派 规则 的 。 





双 杀 委派 模型 的 第 二 次 “被 破坏 ”是 由 这 个 模型 自身 的 缺陷 所 导致 
的 ， 双 杀 委 派 很 好 地 解决 了 各 个 类 加 载 喜 的 基础 类 的 统一 问题 〈 越 基础 
的 类 由 越 上 层 的 加 载 右 进行 加 载 ) ， 基 础 类 之 所 以 称 为 “基础 ?>， 是 因为 
它们 总 是 作为 被 用 户 代码 调用 的 API， 但 世事 往往 没有 绝对 的 完美 ， 如 
果 基 础 类 又 要 调用 回 用 户 的 代码 ， 那 该 怎么 办 ? 


这 并 非 是 不 可 能 的 事情 ， 一 个 典型 的 例子 便 是 JNDI 服 务 ，JNDI 现 
在 已 经 是 Java 的 标准 服务 ， 它 的 代码 由 启动 类 加 载 器 去 加 载 〈 在 JDK 1.3 
时 放 进 去 的 rtjar) ， 但 JNDI 的 目的 就 是 对 资源 进行 集中 管理 和 查找 ， 它 
需要 调用 由 独立 厂商 实现 并 部 署 在 应 用 程序 的 ClassPath 下 的 JNDI 接 口 提 
供 者 〈SPLService Provider Interface) 的 代码 ， 但 启动 类 加 载 器 不 可 


能 < 认识 "这些 代 码 啊 ! 那 该 怎么 办 ? 





为 了 解决 这 个 问题 ，Java 设 计 团 队 只 好 引入 了 一 个 不 太 优 雅 的 设 
计 : 线程 上 下 文 类 加 载 器 (Thread Context ClassLoader) 。 这 个 类 加 载 
器 可 以 通过 java.lang.Thread 类 的 setContextClassLoaser() 方 法 进行 设置 ， 
如 果 创 建 线程 时 还 未 设置 ， 它 将 会 从 父 线程 中 继承 一 个 ， 如 果 在 应 用 程 
序 的 全 局 范围 内 都 没有 设置 过 的 话 ， 那 这 个 类 加 载 器 默认 就 是 应 用 程序 
类 加 载 右 。 


有 了 线程 上 下 文 类 加 载 器 ， 就 可 以 做 一 些 “ 舞 次 ”的 事情 了 ，JNDI 服 
务 使 用 这 个 线程 上 下 文 类 加 载 器 去 加 载 所 需要 的 SPI 代 码 ， 也 就 是 父 类 
加 载 器 请 求 子 类 加 载 器 去 完成 类 加 载 的 动作 ， 这 种 行为 实际 上 就 是 打通 
了 双 杀 委派 模型 的 层次 结构 来 逆向 使 用 类 加 载 器 ， 实 际 上 已 经 违背 了 双 
杀 委 派 模型 的 一 般 性 原则 ， 但 这 也 是 无 可 奈何 的 事情 。Java 中 所 有 涉及 
SPI 的 加 载 动作 基本 上 都 采用 这 种 方式 ， 例 如 JNDI、JDBC、JCE、 
JAXB 和 JBI 等 。 








双 杀 委派 模型 的 第 三 次 “被 破坏 ”是 由 于 用 户 对 程序 动态 性 的 追求 而 
导致 的 ， 这 里 所 说 的 “动态 性 ” 指 的 是 当前 一 些 非常 “热门 ”的 名 词 : 代码 
热 蔡 换 (HotSwap〉、 模 块 热 部 署 (Hot Deployment) 等 ， 说 白 了 就 是 
希望 应 用 程序 能 像 我 们 的 计算 机 外 设 那 样 ， 接 上 鼠标 、U 盘 ， 不 用 重 局 
机 器 就 能 立即 使 用 ， 和 鼠标 有 问题 或 要 升级 就 换个 鼠标 ， 不 用 集 机 也 不 用 
重启 。 对 于 个 人 计算 机 来 说 ， 重 局 一 次 其 实 没 有 什么 大 不 了 的 ， 但 对 于 
一 些 生 产 系统 来 说 ， 关 机 重启 一 次 可 能 就 要 被 列 为 生产 事故 ， 这 种 情况 
下 热 部 获 就 对 软件 开发 者 ， 尤 其 是 企业 级 软件 开发 者 具有 很 大 的 吸引 
Ns 

















Sun 公 司 所 提出 的 JSR-294111、JSR-2770 规 范 在 与 JCP 组 织 的 模块 化 
规范 之 争 中 落 败 给 JSR-291 〈 即 OSGi R4.2) ， 虽 然 Sun 不 甘 失去 Java 模 
块 化 的 主导 权 ， 独 立 在 发 展 Jigsaw 项 目 ， 但 目前 OSGi 已 经 成 为 了 业 
界 * 事 实 上 ”的 Java 模 块 化 标准 中 ， 而 0SGi 实 现 模块 化 热 部 署 的 关键 则 是 


它 自 定义 的 类 加 载 器 机 制 的 实现 。 每 一 个 程序 模块 〈OSGi 中 称 为 
Bundle) 都 有 一 个 目 己 的 类 加 载 器 ， 当 需要 更 换 一 个 Bundle 时 ， 就 把 
Bundle 连 同类 加 载 右 一 起 换 挥 以 实现 代码 的 热 丛 换 。 


在 OSGi 环 境 下 ， 类 加 载 右 不 再 是 双亲 委派 模型 中 的 树 状 结构 ， 而 
征 进一步 发 展 为 更 加 复杂 的 网 状 结构 ， 当 收 到 类 加 载 请 求 时 ，OSGi 将 
按照 下 面 的 顺序 进行 类 搜索 : 





1) 将 以 java.* 开 头 的 类 委派 给 父 类 加 载 右 加载 。 





2) 合 则 ， 将 委派 列表 名 单 内 的 类 委派 给 父 类 加 载 旨 加 载 。 








3) 否则 ， 将 Import 列 表 中 的 类 委派 给 Export 这 个 类 的 Bundle 的 类 加 
载 器 加 载 。 


4) 和 否则， 查找 当前 Bundle 的 ClassPath， 使 用 自己 的 类 加 载 器 加 
载 。 


5) 否则， 查找 类 是 否 在 自己 的 Fragment Bundle 中 ， 如 果 在 ， 则 委 
派 给 Fragment Bundle 的 类 加 载 器 加 载 。 


6) 否则 ， 查 找 Dynamic Import 列 表 的 Bundle， 委 派 给 对 应 Bundle 的 
类 加 载 器 加 载 。 


7) 否则， 关 碍 找 失 败 。 








上 面 的 碍 找 顺序 中 只 有 开头 两 点 仍然 符合 双 杀 委 铸 规则， 其余 的 类 
查找 都 是 在 平 级 的 类 加 载 句 中 进行 的 。 


笔者 虽然 使 用 了 “被 破坏 ”这 个 词 来 形容 上 述 不 符合 双亲 委派 模型 原 
则 的 行为 ， 但 这 里 “被 破坏 ”并 不 带 有 贬义 的 感情 色彩 。 只 要 有 足够 意义 
和 理由 ， 突 破 已 有 的 原则 就 可 认为 是 一 种 创新 。 正 如 OSGi 中 的 类 加 载 
器 并 不 符合 传统 的 双亲 委派 的 类 加 载 器 ， 并 且 业 界 对 其 为 了 实现 热 部 署 
而 带 来 的 额外 的 高 复杂 度 还 存在 不 少 争议 ， 但 在 Java 程 序 员 中 基本 有 一 
个 共识 : OSGi 中 对 类 加 载 器 的 使 用 是 很 值得 学 习 的 ， 弄 履 了 OSGi 的 实 
现 ， 就 可 以 算是 掌握 了 类 加 载 器 的 精髓 。 











[1]JSR-294: Improved Modularity Support in the Java Programming 
Language (Java 编 程 语言 中 的 改进 模块 性 支持 ) 。 

[21JSR-277: Java Module System (Java 模 块 系统 ) 。 

[3] 如 果 读 者 对 Java 模 块 化 之 争 或 者 OSGi 本 身 感 兴趣 ， 可 以 阅读 笔者 的 另 
一 本 书 《 深 入 理解 OSGi:Equinox 原 理 、 应 用 与 最 佳 实践 》。 


7.5 ”本 章 小 结 


本 章 介绍 了 类 加 载 过 程 的 “加 载 "、“ 验 证 ”、“ 准 备 ”、“ 解 析 ” 和 “初始 
化 ”5 个 阶段 中 虚拟 机 进行 了 哪些 动作 ， 还 介绍 了 类 加 载 右 的 工作 原理 及 
其 对 虚拟 机 的 意义 。 





经 过 第 6 和 第 7 两 章 的 讲解 ， 相 信 读 者 已 经 对 如 何在 Class 文 件 中 定义 
类 ， 如 何 将 类 加 载 到 虚拟 机 中 这 两 个 问题 有 了 比较 系统 的 了 解 ， 第 8 重 
我 们 将 一 起 来 看 看 虚拟 机 如 何 执 行 定义 在 Class 文 件 里 的 字 市 码 。 


第 8 章 “” 虚拟 机 字 节 码 执行 引擎 


代码 编译 的 结果 从 本 地 机 器 人 码 转变 为 字 节 人 码 ， 是 存储 格式 发 展 的 一 
小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


8.1 概述 


执行 引擎 是 Java 虚 拟 机 最 核心 的 组 成 部 分 之 一 。“ 虚 拟 机 ”是 一 个 相 
对 于 “物理 机 ?的 概念 ， 这 两 种 机 器 都 有 代码 执行 能 力 ， 其 区 别 是 物理 机 
的 执行 引擎 是 直接 建立 在 处 理 器 、 硬 件 、 指 令 集 和 操作 系统 层面 上 的 ， 
而 虚拟 机 的 执行 引擎 则 是 由 目 己 实现 的 ， 因 此 可 以 目 行 制定 指令 集 与 执 
行 引 擎 的 结构 体系 ， 并 且 能 够 执行 那些 不 被 硬件 直接 文 持 的 指令 集 格 
式 。 





在 Java 虚 拟 机 规范 中 制定 了 虚拟 机 字 节 码 执行 引擎 的 概念 模型 ， 这 
个 概念 模型 成 为 各 种 虚拟 机 执行 引擎 的 统一 外 观 〈EFacade) 。 在 不 同 的 
虚拟 机 实现 里 面 ， 执 行 引擎 在 执行 Java 代 码 的 时 候 可 能 会 有 解释 执行 
通过 解释 器 执行 ) 和 编译 执行 《通过 即时 编译 器 产生 本 地 代码 执行 ) 
两 种 选择 中， 也 可 能 两 者 兼备 ， 甚 至 还 可 能 会 包含 几 个 不 同 级 别 的 编译 
需 执 行 引擎 。 但 从 外 观 上 看 起 来 ， 所 有 的 Java 虚 拟 机 的 执行 引擎 都 是 一 
致 的 : 输入 的 是 字 节 码 文件 ， 处 理 过 程 是 字 节 码 解析 的 等 效 过 程 ， 输 出 


的 是 执行 结果 ， 本 章 将 主要 从 概念 模型 的 角度 来 讲解 虚拟 机 的 方法 调用 
和 字 节 码 执行 。 


[1 有 一 些 虚拟 机 (如 Sun Classic VM) 的 内 部 只 存在 解释 器 ， 只 能 解释 执 
， 而 另外 一 些 虚 拟 机 (如 BEA JRockit) 的 内 部 只 存在 即时 编译 器 ， 只 


)， 和 人 八 
能 编译 执行 。 


8.2 ”运行 时 栈 帧 结构 


栈 帧 (Stack Frame) 是 用 于 文 持 虚 拟 机 进行 方法 调用 和 方法 执行 的 
数据 结构 ， 它 是 虚拟 机 运行 时 数据 区 中 的 虚拟 机 栈 (Virtual Machine 
Stack) 趾 的 栈 元 素 。 栈 帧 存储 了 方法 的 局 部 变量 表 、 操 作 数 栈 、 动 态 连 
接 和 方法 返回 地 址 等 信息 。 每 一 个 方法 从 调用 开始 至 执行 完成 的 过 程 ， 
都 对 应 着 一 个 栈 帧 在 虚拟 机 栈 里 面 从 入 栈 到 出 栈 的 过 程 。 














每 一 个 栈 帧 都 包括 了 局 部 变量 表 、 操 作 数 栈 、 动 态 连接 、 方 法 返回 
地 址 和 一 些 额外 的 附加 信息 。 在 编译 程序 代码 的 时 候 ， 栈 帧 中 需要 多 大 
的 局 部 变量 表 ， 多 深 的 操作 数 栈 都 已 经 完全 确定 了 ， 并 且 写 入 到 方法 表 
的 Code 属 性 之 中 中， 因此 一 个 栈 帧 需要 分 配 多少 内 存 ， 不 会 受到 程序 运 
行 期 变量 数据 的 影响 ， 而 仅仅 取决 于 具体 的 虚拟 机 实现 。 











一 个 线程 中 的 方法 调用 链 可 能 会 很 长 ， 很 多 方法 都 同时 处 于 执行 状 
态 。 对 于 执行 引擎 来 说 ， 在 活动 线程 中 ， 只 有 位 于 栈 顶 的 栈 帧 才 是 有 效 
的 ， 称 为 当前 栈 帧 〈Current Stack Frame) ， 与 这 个 栈 帧 相关 联 的 方法 
称 为 当前 方法 (Current Method) 。 执 行 引 擎 运行 的 所 有 字 节 码 指令 都 
只 针对 当前 栈 帧 进行 操作 ， 在 概念 模型 上 ， 典 型 的 栈 帧 结构 如 图 8-1 所 


帮 \。 


当前 线程 线程 2 线程 n 
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图 8-1 栈 帧 的 概念 结构 


接 下 来 详细 讲解 一 下 栈 帧 中 的 局 部 变量 表 、 操 作 数 栈 、 动 态 连接 、 
方法 返回 地 址 等 各 个 部 分 的 作用 和 数据 结构 。 


8.2.1 局 部 变量 表 





局 部 变量 表 (Local Variable Table) 是 一 组 变量 值 存 储 空间 ， 用 于 
存放 方法 参数 和 方法 内 部 定义 的 局 部 变量 。 在 Java 程 序 编译 为 Class 文 件 
时 ， 就 在 方法 的 Code 属 性 的 max_locals 数 据 项 中 确定 了 该 方法 所 需要 分 
配 的 局 部 变量 表 的 最 大 容量 。 

















局 部 变量 表 的 容量 以 变量 模 (Variable Slot， 下 称 Slot) 为 最 小 单 
位 ， 虚 拟 机 规范 中 并 没有 明确 指明 一 个 Slot 应 占用 的 内 存 空间 大 小 ， 只 
是 很 有 导向 性 地 说 到 每 个 Slot 都 应 该 能 存放 一 个 boolean、byte、char、 
short、int、float、reference 或 returnAddress 类 型 的 数据 ， 这 8 种 数据 类 
型 ， 都 可 以 使 用 32 位 或 更 小 的 物理 内 存 来 存放 ， 但 这 种 描述 与 明确 指 
出 “每 个 Slot 占 用 32 位 长 度 的 内 存 空间 ”是 有 一 些 差别 的 ， 它 允许 Slot 的 长 
度 可 以 随 着 处 理 器 、 操 作 系统 或 虚拟 机 的 不 同 而 发 生变 化 。 只 要 保证 即 
使 在 64 位 虚拟 机 中 使 用 了 64 位 的 物理 内 存 空 间 去 实现 一 个 Slot， 虚 拟 机 
仍 要 使 用 对 齐 和 补 白 的 手段 让 Slot 在 外 观 上 看 起 来 与 32 位 虚拟 机 中 的 一 
致 。 








既然 前 面 提 到 了 Java 虚 拟 机 的 数据 类 型 ， 在 此 再 简单 介绍 一 下 它 
们 。 一 个 Slot 可 以 存放 一 个 32 位 以 内 的 数据 类 型 ，Java 中 占用 32 位 以 内 
的 数据 类 型 有 boolean、byte、char、short、int、float、referencel3l 和 
returmAddress 8 种 类 型 。 前 面 6 种 不 需要 多 加 解释 ， 读 者 可 以 按照 Java 语 
言 中 对 应 数据 类 型 的 概念 去 理解 它们 《〈 仅 是 这 样 理 解 而 已 ，Java 语 言 与 
Java 虚 拟 机 中 的 基本 数据 类 型 是 存在 本 质 差别 的 ) ， 而 第 7 种 reference 类 








型 表示 对 一 个 对 象 实例 的 引用 ， 虚 拟 机 规范 既 没 有 说 明 它 的 长 度 ， 也 没 
有 明确 指出 这 种 引用 应 有 怎样 的 结构 。 但 一 般 来 次 ， 虚 拟 机 实现 至 少 都 
应 当 能 通过 这 个 引用 做 到 两 点 ， 一 是 从 此 引用 中 直接 或 间接 地 碍 找到 对 
象 在 Java 堆 中 的 数据 存放 的 起 始 地 址 索引 ， 二 是 此 引用 中 直接 或 间接 地 
查找 到 对 象 所 属 数据 类 型 在 方法 区 中 的 存储 的 类 型 信息 ， 否 则 无 法 实现 
Java 语 言 规范 中 定义 的 语法 约束 所 。 第 8 种 即 returnAddress 类 型 目前 已 经 
很 少见 了 ， 它 是 为 字 节 人 码 指令 jsr、jsr_w 和 和 ret 服务 的 ， 指 问 了 一 条 学 市 
码 指令 的 地 址 ， 很 吾 老 的 Java 虚 拟 机 曾经 使 用 这 几 条 指令 来 实现 异 贡 处 
理 ， 现 在 已 经 由 异常 表 代 蔡 。 














对 于 64 位 的 数据 类 型 ， 虚 拟 机 会 以 高 位 对 齐 的 方式 为 其 分 配 两 个 连 
续 的 Slot 空间 。Java 语 言 中 明确 的 〈reference 类 型 则 可 能 是 32 位 也 可 能 是 
64 位 ) 64 位 的 数据 类 型 只 有 long 和 double 两 种 。 值 得 一 提 的 是 ， 这 里 把 
long 和 double 数 据 类 型 分 割 存 储 的 做 法 与 ong 和 double 的 非 原 子 性 协 
定 ” 中 把 一 次 long 和 double 数 据 类 型 读 写 分 割 为 两 次 32 位 读 写 的 做 法 有 些 
类 似 ， 读 者 阅读 到 Java 内 存 模型 时 可 以 互相 对 比 一 下 。 不 过 ， 由 于 局 部 
变量 表 建 立 在 线程 的 堆栈 上 ， 是 线程 私有 的 数据 ， 无 论 读 写 两 个 连续 的 
Slot 是 否 为 原子 操作 ， 都 不 会 引起 数据 安全 问题 中 。 














虚拟 机 通过 索引 定位 的 方式 使 用 局 部 变量 表 ， 索 引 值 的 范围 是 从 0 
开始 至 局 部 变量 表 最 大 的 Slot 数量 。 如 果 访 问 的 是 32 位 数据 类 型 的 变 
量 ， 索 引 n 就 代表 了 使 用 第 n 个 Slot， 如 果 是 64 位 数据 类 型 的 变量 ， 则 说 














明 会 同时 使 用 n 和 n+1 两 个 Slot。 对 于 两 个 相 邻 的 共同 存放 一 个 64 位 数据 
的 两 个 Slot， 不 允许 采用 任何 方式 单独 访问 其 中 的 茶 一 个 ，Java 虚 拟 机 
规范 中 明确 要 求 了 如 果 遇 到 进行 这 种 操作 的 字 节 码 序列 ， 虚 拟 机 应 该 在 
类 加 载 的 校 验 阶段 抛 出 异常 。 








在 方法 执行 时 ， 虚 拟 机 是 使 用 局 部 变量 表 完 成 参数 值 到 参数 变量 列 
表 的 传递 过 程 的 ， 如 果 执 行 的 是 实例 方法 《〈 非 static 的 方法 ) ， 那 局 部 变 
量 表 中 第 0 位 索引 的 Slot 默认 是 用 于 传递 方法 所 属 对 象 实例 的 引用 ， 在 方 
法 中 可 以 通过 关键 字 "this" 来 访问 到 这 个 隐 含 的 参数 。 其 余 参数 则 按照 
参数 表 顺 序 排列 ， 王 用 从 1 开始 的 局 部 变量 Slot， 参 数 表 分 配 完毕 后 ， 再 
根据 方法 体内 部 定义 的 变量 顺序 和 作用 域 分 配 其 余 的 Slot。 














为 了 尽 可 能 节省 栈 帧 空间 ， 局 部 变量 表 中 的 Slot 是 可 以 重用 的 ， 方 
法 体 中 定义 的 变量 ， 其 作用 域 并 不 一 定 会 履 兰 整个 方法 体 ， 如 果 当 前 字 
节 码 PC 计数 器 的 值 已 经 超出 了 茶 个 变量 的 作用 域 ， 那 这 个 变量 对 应 的 
Slot 束 可 以 交 给 其 他 变量 使 用 。 不 过 ， 这 样 的 设计 除了 市 省 栈 帧 空间 以 
外 ， 还 会 伴随 一 些 额外 的 副作用 ， 例 如 ， 在 某 些 情况 下 ，Slot 的 复 用 会 
直接 影响 到 系统 的 垃圾 收集 行为 ， 请 看 代码 清单 8-1~ 代 码 清单 8-3 的 3 个 


演示 。 














代码 清单 8-1 局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 一 


public static void main (String[]args) (){ 
byte[l]jplaceholder=new byte{[64*1024*1024]; 











System.gc (); 
} 





代码 清单 8-1 中 的 代码 很 简单 ， 即 向 内 存 填充 了 64MB 的 数据 ， 然 后 
通知 虚拟 机 进行 垃圾 收集 。 我 们 在 虚拟 机 运行 参数 中 加 上 "- 
verbose:gc" 来 看 看 垃圾 收集 的 过 程 ， 发 现在 System.gcO 运 行 后 并 没有 回 
收 这 64MB 的 内 存 ， 下 面 是 运行 的 结 末 : 











[GC 66846K->65824K (125632K) ，0.0032678 secs ] 
[Ful1l GC 65824K->65746K (125632K) ，0.0064131 secs] 








没有 回收 placeholder 所 占 的 内 存 能 说 得 过 去 ， 因 为 在 执行 
System.gc() 时 ， 变 量 placeholder 还 处 于 作用 域 之 内 ， 虚 拟 机 自然 不 敢 回 
收 placeholder 的 内 存 。 那 我 们 把 代码 修改 一 下 ， 变 成 代码 清单 8-2 中 的 样 
本 








代码 清单 8-2 局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 二 





public static void main (String[]args) (){ 
{ 

byte[l]jplaceholder=new byte{[64*1024*1024]; 
} 

System.gc (); 

} 














加 入 了 人 花 插 号 之 后 ，placeholder 的 作用 域 被 限制 在 花 括 号 之 内 ， 从 
代码 逻 辑 上 讲 ， 在 执行 System.gc() 的 时 候 ，placeholder 己 经 不 可 能 再 被 
访问 了 ， 但 执行 一 下 这 上段 程序 ， 会 发 现 运行 结果 如 下 ， 还 是 有 64MB 的 





内 存 没 有 被 回收 ， 这 又 是 为 什么 呢 ? 





[GC 66846K->65888K (125632K) ，0.0009397 secs ] 
[Full GC 65888K->65746K (125632K) ，0.0051574 secs] 





在 解释 为 什么 之 前 ， 我 们 先 对 这 上 段 代 码 进行 第 二 次 修改 ， 在 调用 
System.gc() 之 前 加 入 一 行 "int a=0; "， 变 成 代码 清单 8-3 的 样子 。 








代码 清单 8-3 ”局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 三 





public static void main (String[]args) (){ 
{ 

byte[l]placeholder=new byte [64*1024*1024]; 
} 
int a=0; 
System.gc (); 
} 


























这 个 修改 看 起 来 很 碘 名 其 妙 ， 但 运行 一 下 程序 ， 却 发 现 这 次 内 存 真 
的 被 正确 回收 了 。 





[GC 66401K->>65778K (125632K) ，0.0035471 secs] 
[Full GC 65778K->218K (125632K) ，0.0140596 secs] 





在 代码 清单 8-1~ 代 码 清单 8-3 中 ，placeholder 能 否 被 回收 的 根本 原因 
是 : 局 部 变量 表 中 的 Slot 是 否 还 存 有 关于 placeholder 数 组 对 象 的 引用 。 
第 一 次 修改 中 ， 代 码 虽 然 已 经 离开 了 placeholder 的 作用 域 ， 但 在 此 之 
后 ， 没 有 任何 对 局 部 变量 表 的 读 写 操作 ，placeholder 原 本 所 占用 的 Slot 
还 没有 被 其 他 变量 所 复 用 ， 所 以 作为 GC Roots 一 部 分 的 局 部 变量 表 仍 然 














保持 着 对 它 的 关联 。 这 种 关联 没有 修 及 时 打 断 ， 在 绝 大 部 分 情况 下 影响 
都 很 轻微 。 但 如 果 过 到 一 个 方法 ， 其 后 面 的 代码 有 一 些 耗 时 很 长 的 操 
作 ， 而 前 面 又 定义 了 占用 了 大 量 内 存 、 实 际 上 已 经 不 会 再 使 用 的 变量 ， 
手动 将 其 设置 为 null 值 “用 来 代 丛 那 名 int a=0， 把 变量 对 应 的 局 部 变量 
表 Slot 清 空 ) 便 不 见得 是 一 个 绝对 无 意义 的 操作 ， 这 种 操作 可 以 作为 一 
种 在 极 特 殊 情 形 (对 象 占用 内 存 大 、 此 方法 的 栈 帧 长 时 间 不 能 被 回收 、 
方法 调用 次 数 达 不 到 JIT 的 编译 条 件 ) 下 的 “ 奇 技 ?来 使 用 。Java 语 言 的 一 
本 非常 著名 的 书籍 《Practical Java》 中 把 “不 使 用 的 对 象 应 手动 赋值 为 
null* 作 为 一 条 推荐 的 编码 规则 ， 但 是 并 没有 解释 具体 的 原因 ， 很 长 时 间 
之 内 都 有 读者 对 这 条 规则 感到 疑惑 。 











里 然 代码 清单 8-1~ 代 码 清单 8-3 的 代码 示例 说 明了 赋 null 值 的 操作 在 
某 些 情况 下 确实 是 有 用 的 ， 但 笔者 的 观点 是 不 应 当 对 赋 null 值 的 操作 有 
过 多 的 依赖 ， 更 没有 必要 把 它 当 做 一 个 普遍 的 编码 规则 来 推广 。 原 因 有 
两 点 ， 从 编码 角度 讲 ， 以 恰当 的 变量 作用 域 来 控制 变量 回收 时 间 才 是 最 
优雅 的 解决 方法 ， 如 代码 清单 8-3 那 样 的 场景 并 不 多 见 。 更 关键 的 是 ， 
从 执行 角度 讲 ， 使 用 赋 null 值 的 操作 来 优化 内 存 回 收 是 建立 在 对 字 节 码 
执行 引擎 概 念 模 型 的 理解 之 上 的 ， 在 第 6 章 介绍 完 字 市 码 后 ， 笔 者 专门 
增加 了 一 个 6.5 闻 “公有 设计 、 私 有 实现 ”来 强调 概念 模型 与 实际 执行 过 程 
征 外 部 看 起 来 等 效 ， 内 部 看 上 去 则 可 以 完全 不 同 。 在 虚拟 机 使 用 解释 器 
执行 时 ， 通 常 与 概念 模型 还 比较 接近 ， 但 经 过 JIT 编 译 占 后 ， 才 是 虚拟 
机 执行 代码 的 主要 方式 ， 赋 null 值 的 操作 在 经 过 JIT 编 译 优 化 后 就 会 被 消 














除 掉 ， 这 时 候 将 变量 设置 为 null 就 是 没有 意义 的 。 字 节 码 被 编译 为 本 地 
代码 后 ， 对 GC Roots 的 枚 举 也 与 解释 执行 时 期 有 巨大 差别 ， 以 前 面 例子 
来 看 ， 代 人 码 清 单 8-2 在 经 过 JIT 编 译 后 ，System.gc() 执 行 时 就 可 以 正确 地 
回收 掉 内 存 ， 无 须 写成 代码 清单 8-3 的 样子 。 

















关于 局 部 变量 表 ， 还 有 一 点 可 能 会 对 实际 开发 产生 影响 ， 就 是 局 部 
变量 不 像 前 面 介 绍 的 类 变量 那样 存在 “准备 阶段 *。 通 过 第 7 章 的 讲解 ， 
我 们 已 经 知道 类 变量 有 两 次 赋 初 始 值 的 过 程 ， 一 次 在 准备 阶段 ， 赋 予 系 
统 初 始 值 ， 力 外 一 次 在 初始 化 阶段 ， 赋 予 程序 员 定 义 的 初始 值 。 因 此 ， 
即使 在 初始 化 阶段 程序 员 没 有 为 类 变量 赋值 也 没有 关系 ， 类 变量 仍然 具 
有 一 个 确定 的 初始 值 。 但 局 部 变量 丈 不 一 样 ， 如 果 一 个 局 部 变量 定义 了 
但 没有 赋 初 始 值 是 不 能 使 用 的 ， 不 要 认为 Java 中 任何 情况 下 都 存在 诸如 
整 型 变量 默认 为 0， 布 尔 型 变量 默认 为 false 等 这 样 的 默认 值 。 如 代码 清 
单 8-4 所 示 ， 这 上段 代码 其 实 并 不 能 运行 ， 还 好 编译 器 能 在 编译 期 间 就 检 
查 到 并 提示 这 一 点 ， 即 便 编译 能 通过 或 者 手动 生成 字 节 码 的 方式 制造 出 
下 面 代码 的 效果 ， 字 节 码 校 验 的 时 候 也 会 被 虚拟 机 发 现 而 导致 类 加 载 失 
败 。 























代码 清单 8-4 未 赋值 的 局 部 变量 





public static void main (String[]args) { 
int ai 

System.out.println (a) ; 

} 


[1 详细 内 容 请 参见 2.2 节 的 相关 内 容 。 

详细 内 容 请 参见 6.3.7 节 的 相关 内 容 。 

[3Uava 虚 拟 机 规范 中 没有 明确 规定 feference 类 型 的 长 度 ， 它 的 长 度 与 实 
际 使 用 32 还 是 64 位 虚拟 机 有 关 ， 如 果 是 64 位 虚拟 机 ， 还 与 是 否 开 启 茶 些 
对 象 指 针 压 缩 的 优化 有 关 ， 这 里 暂且 只 取 32 位 虚拟 机 的 tefetence 长 度 。 
困 并 不 是 所 有 语言 的 对 象 引 用 都 能 满足 这 两 点 ， 例 如 C++ 语言 ， 默 认 情 
况 下 (不 开启 RTTI 支 持 的 情况 ) ， 就 只 能 满足 第 一 点 ， 而 不 满足 第 二 
点 。 这 也 是 为 何 C++ 中 提供 Java 语 言 里 很 常见 的 反射 的 根本 原因 。 
[5] 这 是 Java 内 存 模 型 中 定义 的 内 容 ， 关 于 原子 操作 与 “long 和 double 的 非 
原子 性 协定 ”等 问题 ， 将 在 本 书 第 12 章 中 详细 讲解 。 


8.2.2 ”操作 数 栈 


操作 数 栈 (Operand Stack) 也 常 称 为 操作 栈 ， 它 古 一 个 后 入 先 出 
(Last In First OubLIFO) 栈 。 同 局 部 变量 表 一 样 ， 操 作 数 栈 的 最 大 深度 
也 在 编译 的 时 候 写 入 到 Code 属 性 的 max_stacks 数 据 项 中 。 操 作 数 栈 的 每 
一 个 元 素 可 以 是 任意 的 Java 数 据 类 型 ， 包 括 long 和 double。32 位 数据 类 
型 所 占 的 栈 容量 为 1，64 位 数据 类 型 所 占 的 栈 容量 为 2。 在 方法 执行 的 任 
何 时 候 ， 操 作 数 栈 的 深度 都 不 会 超过 在 max_stacks 数 据 项 中 设 定 的 最 大 
值 。 








当 一 个 方法 刚刚 开始 执行 的 时 候 ， 这 个 方法 的 操作 数 栈 是 空 的 ， 在 
方法 的 执行 过 程 中 ， 会 有 各 种 字 节 码 指令 往 操 作 数 栈 中 写 入 和 提取 内 
容 ， 也 就 是 出 栈 / 入 栈 操作 。 例 如 ， 在 做 算术 运算 的 时 候 是 通过 操作 数 
栈 来 进行 的 ， 又 或 者 在 调用 其 他 方法 的 时 候 是 通过 操作 数 栈 来 进行 参数 
传递 的 。 








举 个 例子 ， 整 数 加 法 的 字 节 码 指令 iadd 在 运行 的 时 候 操 作 数 栈 中 最 
接近 栈 项 的 两 个 元 系 已 经 存 入 了 两 个 int 型 的 数值 ， 当 执行 这 个 指令 时 ， 
会 将 这 两 个 int 值 出 栈 并 相 加 ， 然 后 将 相 加 的 结果 入 栈 。 








操作 数 栈 中 元 系 的 数据 类 型 必须 与 字 市 码 指 令 的 序列 严格 匹配 ， 在 
编译 程序 代码 的 时 候 ， 编 译 器 要 严格 保证 这 一 点 ， 在 类 校 验 阶段 的 数据 


流 分 析 中 还 要 再 次 验证 这 一 点 。 再 以 上 面 的 iadd 指 令 为 例 ， 这 个 指令 用 
于 整 型 数 加 法 ， 它 在 执行 时 ， 最 接近 栈 顶 的 两 个 元 素 的 数据 类 型 必须 为 
int 型 ， 不 能 出 现 一 个 long 和 一 个 float 使 用 iadd 命 令 相 加 的 情况 。 


另外 ， 在 概念 模型 中 ， 两 个 栈 帧 作为 虚拟 机 栈 的 元 素 ， 是 完全 相互 
独立 的 。 但 在 大 多 虚拟 机 的 实现 里 都 会 做 一 些 优化 处 理 ， 令 两 个 栈 帧 出 
现 一 部 分 重合 。 让 下 面 栈 帧 的 部 分 操作 数 栈 与 上 面 栈 帧 的 部 分 局 部 变量 
表 重 膨 在 一 起 ， 这 样 在 进行 方法 调用 时 就 可 以 共用 一 部 分 数据 ， 无 须 进 
行 额 外 的 参数 复制 传递 ， 重 登 的 过 程 如 图 8-2 所 示 。 


操作 数 栈 


其 他 栈 帧 信息 


局 部 变量 表 


操作 数 栈 共享 区 域 重 登 区域 局 部 变量 表 共 享 区 域 


操作 数 栈 





其 他 栈 帧 信息 


局 部 变量 表 


图 8-2 两 个 栈 帧 之 间 的 数据 共享 





Java 庶 拟 机 的 解释 执行 引擎 称 为 “基于 栈 的 执行 引擎 >， 其 中 所 指 
的 “ 栈 ? 就 是 操作 数 栈 。 本 章 稍 后 会 对 基于 栈 的 代码 过 程 进行 更 详细 的 讲 


解 。 








8.2.3 ”动态 连接 


每 个 栈 帧 都 包含 一 个 指向 运行 时 常量 池 帆 中 该 栈 帧 所 属 方法 的 引 
用 ， 持 有 这 个 引用 是 为 了 支持 方法 调用 过 程 中 的 动态 连接 (Dynamic 
Linking) 。 通 过 第 6 章 的 讲解 ， 我 们 知道 Class 文 件 的 常量 池 中 存 有 大 量 
的 符号 引用 ， 字 节 码 中 的 方法 调用 指令 就 以 常量 池 中 指向 方法 的 符号 引 
用 作为 参数 。 这 些 符号 引用 一 部 分 会 在 类 加 载 阶段 或 者 第 一 次 使 用 的 时 
候 就 转化 为 直接 引用 ， 这 种 转化 称 为 静态 解析 。 另 外 一 部 分 将 在 每 一 次 
运行 期 间 转化 为 直接 引用 ， 这 部 分 称 为 动态 连接 。 关 于 这 两 个 转化 过 程 
的 详细 信息 ， 将 在 8.3 节 中 详细 讲解 。 











各 运行 时 常量 池 可 参考 第 2 章 。 


8.24， 方法 返回 好 址 


当 一 个 方法 开始 执行 后 ， 只 有 两 种 方式 可 以 退出 这 个 方法 。 第 一 种 
方式 是 执行 引擎 遇 到 任意 一 个 方法 返回 的 字 节 码 指令 ， 这 时 候 可 能 会 有 
返回 值 传递 给 上 层 的 方法 调用 者 《调用 当前 方法 的 方法 称 为 调用 者 ) ， 
是 否 有 返回 值 和 返回 值 的 类 型 将 根据 过 到 何 种 方法 返回 指令 来 决定 ， 这 
种 退出 方法 的 方式 称 为 正常 完成 出 口 (Normal Method Invocation 





Completion) 。 





男 外 一 种 退出 方式 是 ， 在 方法 执行 过 程 中 过 到 了 异常 ， 并 且 这 个 异 
常 没 有 在 方法 体内 得 到 处 理 ， 无 论 是 Java 虚 拟 机 内 部 产生 的 异常 ， 还 是 
代码 中 使 用 athrow 字 节 码 指令 产生 的 异常 ， 只 要 在 本 方法 的 异常 表 中 没 
有 搜索 到 匹配 的 噶 常 处 理 器 ， 就 会 导致 方法 退出 ， 这 种 退出 方法 的 方式 
称 为 异常 完成 出 口 〈Abrupt Method Invocation Completion ) 。 一 个 方法 
使 用 异常 完成 出 口 的 方式 退出 ， 是 不 会 给 它 的 上 层 调用 者 产生 任何 返回 
值 的 。 














无 论 采 用 何 种 退出 方式 ， 在 方法 退出 之 后 ， 都 需要 返回 到 方法 被 调 
用 的 位 置 ， 程 序 才能 继续 执行 ， 方 法 返回 时 可 能 需要 在 栈 帧 中 保存 一 些 
言 轧 ， 用 来 帮助 恢复 它 的 上 层 方 法 的 执行 状态 。 一 般 来 将 ， 方 法 正常 退 
出 时 ， 调 用 者 的 PC 计数 器 的 值 可 以 作为 返回 地 址 ， 栈 帧 中 很 可 能 会 保 











存 这 个 计数 器 值 。 而 方法 异常 退出 时 ， 返 回 地 址 是 要 通过 异常 处 理 右 表 
来 确定 的 ， 栈 帧 中 一 般 不 会 保存 这 部 分 信息。 


方法 退出 的 过 程 实际 上 残 等 同 于 把 当前 栈 帧 出 栈 ， 因 此 退出 时 可 能 
执行 的 操作 有 : 恢复 上 层 方法 的 局 部 变量 表 和 操作 数 栈 ， 把 返回 值 〈 如 
朵 有 的 话 ) 压 入 调用 者 栈 帧 的 操作 数 栈 中 ， 调 整 PC 计数 需 的 值 以 指 同 
方法 调用 指令 后 面 的 一 条 指令 等 。 





8.2.5 ”附加 信息 


虚拟 机 规范 允许 具体 的 虚拟 机 实现 增加 一 些 规范 里 没有 描述 的 信息 
到 栈 帧 之 中 ， 例 如 与 调试 相关 的 信息 ， 这 部 分 信息 完全 取决 于 具体 的 虚 
拟 机 实现 ， 这 里 不 再 详 述 。 在 实际 开发 中 ， 一 般 会 把 动态 连接 、 方 法 返 
回 地 址 与 其 他 附加 信息 全 部 归 为 一 类 ， 称 为 栈 帧 信息 。 











8.3 ”方法 调用 


方法 调用 并 不 等 同 于 方法 执行 ， 方 法 调用 阶段 唯一 的 任务 束 是 确定 
被 调用 方法 的 版 本 《 即 调用 哪 一 个 方法 ) ， 和 暂时 还 不 涉及 方法 内 部 的 具 
体 运 行 过 程 。 在 程序 运行 时 ， 进 行 方 法 调用 是 最 普 裔 、 最 频繁 的 操作 ， 
但 前 面 已 经 讲 过 ，Class 文 件 的 编译 过 程 中 不 包含 传统 编译 中 的 连接 步 
又 ， 一 切 方法 调用 在 Class 文 件 里 面 存储 的 都 只 是 符号 引用 ， 而 不 是 方法 
在 实际 运行 时 内 存 布局 中 的 入 口 地 址 〈 相 当 于 之 前 说 的 直接 引用 ) 。 这 
个 特性 给 Java 市 来 了 更 强大 的 动态 扩展 能 力 ， 但 也 使 得 Java 方 法 调用 过 
程 变 得 相对 复杂 起 来 ， 需 要 在 类 加 载 期 间 ， 甚 全 到 运行 期 间 才 能 确定 目 
标 方 法 的 直接 引用 。 











8.3.1 解析 


继续 前 面 关于 方法 调用 的 话题 ， 所 有 方法 调用 中 的 目标 方法 在 Class 
文件 里 面部 是 一 个 常量 池 中 的 符 写 引用 ， 在 类 加 载 的 解析 阶段 ， 会 将 其 
中 的 一 部 分 符号 引用 转化 为 直接 引用 ， 这 种 解析 能 成 立 的 前 提 是 : 方法 
在 程序 真正 运行 之 前 束 有 一 个 可 确定 的 调用 版 本 ， 并 且 这 个 方法 的 调用 
版 本 在 运行 期 是 不 可 改变 的 。 换 句 话说 ， 调 用 目标 在 程序 代码 写 好 、 编 
译 需 进行 编译 时 就 必须 确定 下 来 。 这 类 方法 的 调用 称 为 解析 


(Resolution ) 。 




















在 Java 语 言 中 符合 “编译 期 可 知 ， 运 行 期 不 可 变 ” 这 个 要 求 的 方法 ， 
主要 包括 静态 方法 和 私有 方法 两 大 类 ， 前 者 与 类 型 直接 关联 ， 后 者 在 外 
部 不 可 被 访问 ， 这 两 种 方法 各 目的 特点 决定 了 它们 都 不 可 能 通过 继承 或 
别 的 方式 重 写 其 他 版 本 ， 因 此 它们 都 适合 在 类 加 载 阶段 进行 解析 。 











与 之 相对 应 的 是 ， 在 Java 虚 拟 机 里 面 提供 了 5 条 方法 调用 字 节 码 指 
分别 如 下 4 


心 


invokestatic: 调用 静态 方法 。 


invokespecial: 调用 实例 构造 器 过 init> 方 法 、 私 有 方法 和 父 类 方 
> 


invokevirtual: 调用 所 有 的 虚 方法 。 


invokeinterface: 调用 接口 方法 ， 会 在 运行 时 再 确定 一 个 实现 此 接 
口 的 对 象 。 





invokedynamic: 驳 在 运行 时 动态 解析 出 调用 点 限定 符 所 引用 的 方 
法 ， 然 后 再 执行 该 方法 ， 在 此 之 前 的 4 条 调用 指令 ,分派 逻辑 是 固化 在 
Java 虚 拟 机 内 部 的 ， 而 invokedynamic 指 令 的 分 派 逻辑 是 由 用 户 所 设 定 的 
引导 方法 决定 的 。 


只 要 能 被 imvokestatic 和 invokespecial 指 令 调 用 的 方法 ， 都 可 以 在 解 
析 阶 段 中 确定 唯一 的 调用 版 本 ， 符 合 这 个 条 件 的 有 静态 方法 、 私 有 方 





法 、 实 例 构 造 器 、 父 类 方法 4 类 ， 它 们 在 类 加 载 的 时 候 就 会 把 符号 引用 

解析 为 该 方法 的 直接 引用 。 这 些 方法 可 以 称 为 非 虚 方法 ， 与 之 相反 ， 其 
他 方法 称 为 虚 方 法 《除去 final 方 法 ， 后 文 会 提 到 ) 。 代 码 清单 8-5 演 示 了 
一 个 最 常见 的 解析 调用 的 例子 ， 此 样 例 中 ， 静 态 方法 sayHello0 只 可 能 

属于 类 型 StaticResolution， 没 有 任何 手段 可 以 履 盖 或 隐藏 这 个 方法 。 


代码 清单 8-5 “方法 静态 解析 演示 





/* x 
* 方 法 静态 解析 演示 
大 





xQ@author zzm 

WA 

public class StaticResolutiont 
public static void sayHello(){ 
System.out .println ("hello wor1ldq") ; 
} 
public static void main (String[]args) 1 
StaticResolution.sayHello (); 

} 

} 














使 用 javap 命 令 人 查看 这 上 段 程序 的 字 节 人 码 ， 会 发 现 的 确 是 通过 
invokestatic 命 令 来 调用 sayHello0) 方 法 的 。 





D: \Develop\>javap-verbose StaticResolution 
public static void main (java.lang.String[]):; 
Code: 

Stack=0, Locals=1, Args _ size=] 
0:invokestatic#31; //Method sayHello: ()V 
3:return 

LineNumberTable: 

line 15:0 

line 16:3 




















| 


Java 中 的 非 虚 方 法 除了 使 用 invokestatic、invokespecial 调 用 的 方法 之 
外 还 有 一 种 ， 就 是 被 fnal 修 饰 的 方法 。 虽 然 final 方 法 是 使 用 invokevirtual 
站 令 来 调用 的 ， 但 是 由 于 它 无 法 被 覆盖 ， 没 有 其 他 版 本 ， 所 以 也 无 须 对 
方法 接收 者 进行 多 态 选 择 ， 又 或 者 说 多 态 选 择 的 结果 肯定 是 唯一 的 。 在 
Java 语 言 规范 中 明确 说 明了 final 方 法 是 一 种 非 虚 方法 。 





解析 调用 一 定 是 个 静态 的 过 程 ， 在 编译 期 间 就 完全 确定 ， 在 类 装载 
的 解析 阶段 就 会 把 涉及 的 符号 引用 全 部 转变 为 可 确定 的 直接 引用 ， 不 会 
延迟 到 运行 期 再 去 完成 。 而 分 派 (Dispatch) 调用 则 可 能 是 静态 的 也 可 
能 是 动态 的 ， 根 据 分 派 依据 的 宗 量 数 器 可 分 为 单 分 派 和 多 分 派 。 这 两 类 
分 派 方式 的 两 两 组 合 就 构成 了 静态 单 分 派 、 静 态 多 分 派 、 动 态 单 分 派 、 
动态 多 分 派 4 种 分 派 组 合 情 况 ， 下 面 我 们 再 看 看 虚拟 机 中 的 方法 分 派 是 
如 何 进行 的 。 








[1 这 里 涉及 的 分 派 的 相关 概念 (如 “ 宗 量 ”等 ) 在 后 文中 都 会 有 所 解 


8.3.2 分派 


众所周知 ，Java 是 一 门面 向 对 象 的 程序 语言 ， 因 为 Java 具 备 面 向 对 
象 的 3 个 基本 特征 : 继承 、 封 装 和 多 态 。 本 节 讲 解 的 分 派 调 用 过 程 将 会 
揭示 多 态 性 特征 的 一 些 最 基本 的 体现 ， 如 “ 重 载 ?和 “ 重 写 ” 在 Java 虚 拟 机 
之 中 是 如 何 实现 的 ， 这 里 的 实现 当然 不 是 语法 上 该 如 何 写 ， 我 们 关心 的 
依然 是 虚拟 机 如 何 确定 正确 的 目标 方法 。 


1. 静 态 分 派 


在 开始 讲解 静态 分 派 六 前 ， 笔 者 准备 了 一 段 经 常 出 现在 面试 题 中 的 
程序 代码 ， 读 者 不 妨 先 看 一 过 ， 想 一 下 程序 的 输出 结果 是 什么 。 后 面 我 
们 的 话题 将 围绕 这 个 类 的 方法 来 重 载 (Overload) 代码 ， 以 分 析 虚 拟 机 
和 编译 器 确定 方法 版 本 的 过 程 。 方 法 静态 分 派 如 代码 清单 8-6 所 示 。 





代码 清单 8-6 ”方法 静态 分 派 演 示 











package org.fenixsoft.polymorphic; 
/** 
* 方 法 静态 分 派 演示 


xQauthor zzm 





‘og, 


ublic class StaticDispateht 
tatic abstract class Humant 











tatic class Man extends Humant{ 














tatic class Woman extends Humant{ 


-一 mn 一 0 一 Un * 


public void sayHello (Human guy) { 
System.out .println ("hello,guy! ") ; 
} 
public void sayHello (Man guy) 1 
System.out.println ("hello,gentleman! ") ; 
} 
public void sayHello (Woman guy) { 
System.out.println ("hello,lady! ") ; 

} 

public static void main (String[]args) 1 
Human man=new Man ( ) ; 

Human woman=new Woman ( ) ; 

StaticDispatch sr=new StaticDispatch () ; 
sr.sayHello (man) ; 

sr.sayHello (woman) ; 





















































二 了 汪 六 全 
运行 结果 
hello,guy! 
hello,guy! 








代码 清单 8-6 中 的 代码 实际 上 是 在 考验 阅读 者 对 重 载 的 理解 程度 ， 
相信 对 Java 编 程 棚 有 经 验 的 程序 员 看 完 程 序 后 者 能 得 出 正确 的 运行 结 
果 ， 但 为 什么 会 选择 执行 参数 类 型 为 Human 的 重 载 呢 ? 在 解决 这 个 问题 
之 前 ， 我 们 先 按 如 下 代码 定义 两 个 重要 的 概念 。 














Human man=new Man ( ) ; 





我 们 把 上 面 代码 中 的 "Human" 称 为 变量 的 静态 类 型 〈Static 
Type) ， 或 者 叫做 的 外 观 类 型 (Apparent Type) ， 后 面 的 "Man" 则 称 为 
变量 的 实际 类 型 (Actual Type) ， 静 态 类 型 和 实际 类 型 在 程序 中 都 可 以 





发 生 一 些 变化 ， 区 别 是 静态 类 型 的 变化 仅仅 在 使 用 时 发 生 ， 变 量 本 身 的 
静态 类 型 不 会 被 改变 ， 并 且 最 终 的 静态 类 型 是 在 编译 期 可 知 的 ;而 实际 
类 型 变化 的 结果 在 运行 期 才 可 确定 ， 编 译 器 在 编译 程序 的 时 候 并 不 知道 
一 个 对 象 的 实际 类 型 是 什么 。 例 如 下 面 的 代码 : 





/ /实际 类 型 变化 

Human man=new Man (); 
man=new Woman ( ) ; 

/ /静态 类 型 变化 

sr.sayHello ( (Man) man) 
sr.sayHello ( (Woman) man) 




















解释 了 这 两 个 概念 ， 再 回 到 代码 清单 8-6 的 样 例 代码 中 。main() 里 面 
的 两 次 sayHello0) 方 法 调用 ， 在 方法 接收 者 已 经 确定 是 对 象 "Sr" 的 前 提 
下 ， 使 用 哪个 重 载 版 本 ， 束 完全 取决 于 传 入 参数 的 数量 和 数据 类 型 。 代 
码 中 刻意 地 定义 了 两 个 静态 类 型 相同 但 实际 类 型 不 同 的 变量 ,但 虚拟 机 
《准确 地 次 是 编译 器 ) 在 重 载 时 是 通过 参数 的 静态 类 型 而 不 是 实际 类 型 
作为 判定 依据 的 。 并 且 静 态 类 型 是 编译 期 可 知 的 ， 因 此 ， 在 编译 阶段 ， 
Javac 编 译 器 会 根据 参数 的 静态 类 型 决定 使 用 哪个 重 载 版 本 ， 所 以 选择 
了 sayHello (Human) 作为 调用 目标 ， 并 把 这 个 方法 的 符 写 引用 写 到 
main() 方 法 里 的 两 条 invokevirtual 指 令 的 参数 中 。 











所 有 依赖 静态 类 型 来 定位 方法 执行 版 本 的 分 派 动 作 称 为 静态 分 派 。 
静态 分 派 的 典型 应 用 是 方法 重 载 。 静 态 分 派发 生 在 编译 阶段 ， 因 此 确定 
静态 分 派 的 动作 实际 上 不 是 由 虚拟 机 来 执行 的 。 另 外 ， 编 诺 器 虽然 能 确 











定 出 方法 的 重 载 版 本 ， 但 在 很 多 情况 下 这 个 重 载 版 本 并 不 是 “唯一 的 ”， 
往往 只 能 确定 一 个 “更 加 合适 的 ?版 本 。 这 种 模糊 的 结论 在 由 0 和 1 构成 的 
计算 机 世界 中 算是 比较 “稀罕 ”的 事情 ， 产 生 这 种 模糊 结论 的 主要 原因 是 
字面 量 不 需要 定义 ， 所 以 字面 量 没有 显 式 的 静态 类 型 ， 它 的 静态 类 型 只 
能 通过 语言 上 的 规则 去 理解 和 推 盯 。 代 码 清单 8-7 演 示 了 何 为 "更 加 合适 
的 ”版 本 。 














代码 清单 8-7 重 载 方法 匹配 优先 级 











package org.fenixsoft.polymorphic; 
public class Overloadt{ 
public static void sayHello (Object arg) 1 
System.out .println ("hello Object" ) ; 

} 
public static void sayHello (int arg) { 
System.out .println ("nello int") ; 

} 
public static void sayHello (long arg) 1 
System.out.println ("hello long"); 

} 
public static void sayHello (Character arg) { 
System.out.println ("hello Character'" ) ; 

} 
public static void sayHello (char arg) 1 
System.out.println ("hello char") ; 

} 
public static void sayHello (char.....arg) 1 
System.out.println ("hello char..."); 

} 
public static void sayHello (Serializable arg) 1 
System.out.println ("hello Serializable") ; 

} 
public static void main (String[]args) 1 
sayHello ('a').; 

} 

} 


ee | 


















































上 面 的 代码 运行 后 会 输出 : 


hello char 





这 很 好 理解 ，'a' 是 一 个 char 类 型 的 数据 ， 上 自然 会 寻找 参数 类 型 为 
char 的 重 载 方法 ， 如 果 注 释 掉 sayHello (char arg) 方法 ， 那 输出 会 变 
为 : 





hello int 


这 时 发 生 了 一 次 目 动 类 型 转换 ，'a 除 了 可 以 代表 一 个 字符 串 ， 还 可 
以 代表 数字 97【〈 字 符 a 的 Unicode 数 值 为 十 进 制 数 字 97) ， 因 此 参数 类 型 
为 int 的 重 载 也 是 合适 的 。 我 们 继续 注释 掉 sayHello (int arg) 方法 ， 那 输 
中 会 变 为 : 


hello long 





这 时 发 生 了 两 次 自动 类 型 转换 ，'a' 转 型 为 整数 97 之 后 ， 进 一 步 转型 
为 长 整数 97L， 匹 配 了 参数 类 型 为 long 的 重 载 。 笔 者 在 代码 中 没有 写 其 
他 的 类 型 如 float、double 等 的 重 载 ， 不 过 实际 上 自动 转型 还 能 继续 发 生 
多 次 ， 按 照 char- 之 int- 之 long- 之 float->>double 的 顺序 转型 进行 匹配 。 但 
不 会 轧 配 到 byte 和 short 类 型 的 重 载 ， 因 为 char 到 byte 或 short 的 转型 是 不 安 
全 的 。 我 们 继续 注释 掉 sayHello (long arg) 方法 ， 那 输出 会 变 为 : 





hello Character 





这 时 发 生 了 一 次 自动 装 箱 ，'"a 被 包 闭 为 它 的 封装 类 型 
java.lang.Character， 所 以 匹配 到 了 参数 类 型 为 Character 的 重 载 ， 继 续 注 
释 掉 sayHello (Character arg) 方法 ， 那 输出 会 变 为 : 





hello Serializable 














这 个 输出 可 能 会 让 人 感觉 摸 不 着 头脑 ， 一 个 字符 或 数字 与 序列 化 有 
什么 关系 ? 出 现 hello Serializable， 是 因为 java.lang.Serializable 是 
java.lang.Character 类 实现 的 一 个 接口 ， 当 自动 装 箱 之 后 发 现 还 是 找 不 到 
装 箱 类 ， 但 是 找到 了 装 箱 类 实现 了 的 接口 类 型 ， 所 以 紧 接着 义 发 生 一 次 
目 动 转型 。char 可 以 转型 成 int， 但 是 Character 是 绝对 不 会 转型 为 Integer 
的 ， 它 只 能 安全 地 转型 为 它 实现 的 接口 或 父 类 。Character 还 实现 了 另外 
一 个 接口 java.lang.Comparable<Character 之 ， 如 果 同 时 出 现 两 个 参数 分 
别 为 Serializable 和 Comparable 二 Character> 的 重 载 方法 ， 那 它们 在 此 时 
的 优先 级 是 一 样 的 。 编 译 器 无 法 确定 要 自动 转型 为 哪 种 类 型 ， 会 提示 类 
型 模糊 ， 拒 绝 编译 。 程 序 必 须 在 调用 时 显 式 地 指定 字面 量 的 静态 类 型 ， 
如 : sayHello 〈 (Comparable<Character>) 'a) ， 才 能 编译 通过 。 下 面 
继续 注释 掉 sayHello (Serializable arg) 方法 ， 输 出 会 变 为 : 





hello Object 





这 时 是 char 闭 箱 后 转型 为 父 类 了 ， 如 果 有 多 个 父 类 ， 那 将 在 继承 关 


系 中 从 下 往 上 开始 搜索 ， 越 接近 上 层 的 优先 级 越 低 。 即 使 方法 调用 传 入 
的 参数 值 为 nul 时 ， 这 个 规则 仍然 适用 。 我 们 把 sayHello (Object arg) 
也 注释 挥 ， 输 出 将 会 变 为 : 





hello char...... 


7 个 重 载 方法 已 经 被 注释 得 只 剩 一 个 了 ， 可 见 变 长 参数 的 重 载 优 先 
级 是 最 低 的 ， 这 时 候 字 符 'a' 被 当做 了 一 个 数组 元 素 。 笔 者 使 用 的 是 char 
类 型 的 变 长 参数 ， 读 者 在 验证 时 还 可 以 选择 int 类 型 、Character 类 型 、 
Object 类 型 等 的 变 长 参数 重 载 来 把 上 面 的 过 程 重 新 演示 一 人 过。 但 要 注意 
的 是 ， 有 一 些 在 单个 参数 中 能 成 立 的 目 动 转型 ， 如 char 转 型 为 int， 在 变 
长 参数 中 是 不 成 立 的 中 。 














代码 清单 8-7 沽 示 了 编译 期 间 选 择 静 态 分派 目 标的 过 程 ， 这 个 过 程 
也 是 Java 语 言 实现 方法 重 载 的 本 质 。 演 示 所 用 的 这 段 程 序 属于 很 极端 的 
例子 ， 除 了 用 做 面试 题 为 难 求职 者 以 外 ， 在 实际 工作 中 几乎 不 可 能 有 实 
际 用 途 。 笔 者 拿 来 做 演示 仅仅 是 用 于 讲解 重 载 时 目标 方法 选择 的 过 程 ， 
大 部 分 情况 下 进行 这 样 极 端的 重 载 都 可 算是 真正 的 “关于 再 香 豆 的 再 有 
几 种 写法 的 研究 ”。 无 论 对 重 载 的 认识 有 多 么 深刻 ， 一 个 合格 的 程序 员 
都 不 应 该 在 实际 应 用 中 写 出 如 此 极端 的 重 载 代码 。 














另外 还 有 一 点 读者 可 能 比较 容易 混 消 : 笔者 讲述 的 解析 与 分 派 这 两 
者 之 间 的 关系 并 不 是 二 选 一 的 排他 关系 ， 邱 们 是 在 不 同 层次 上 去 乌 选 、 





确定 目标 方法 的 过 程 。 例 如 ， 前 面 说 过 ， 静 态 方法 会 在 类 加 载 期 就 进行 
解析 ， 而 静态 方法 显然 也 是 可 以 拥有 重 载 版 本 的 ， 选 择 重 载 版 本 的 过 程 
也 是 过 静态 分 ) 派 完成 的 。 





2. 动 态 分 3 


i 


了 解 了 静态 分 派 ， 我 们 接 下 来 看 一 下 动态 分 派 的 过 程 ， 它 和 多 态 性 
的 另外 一 个 重要 体现 中 一 一 重 写 (Override〉 有 着 很 密切 的 关联 。 我 们 
还 是 用 前 面 的 Man 和 Woman 一 起 sayHello 的 例子 来 讲解 动态 分 派 ， 请 看 
代码 清单 8-8 中 所 示 的 代码 。 


代码 清单 8-8 ”方法 动态 分 派 演示 











package org.fenixsoft.polymorphic; 
/** 

* 方 法 动态 分 派 演 示 

*Q@Qauthor zzm 

4 

public class DynamicDispatcht{ 
static abstract class Humant{ 
protected abstract void sayHello (); 
} 
static class Man extends Humant 
QOverride 

protected void sayHello()f{ 
System.out.println ("man say hello"),; 

} 

} 

static class Woman extends Human{ 
QOverride 

protected void sayHello()f{ 
System.out.println ("woman say hello"), 
} 

} 

public static void main (String[]args) 1 














Human man=new Man ( ) ; 
Human woman=new Woman ( ) ; 
man.sayHello(); 
woman.sayHello (); 
man=new Woman (); 
man.sayHello(); 








man say hello 
woman say hello 
woman say hello 




















这 个 运行 结果 相信 不 会 出 卑 任何 人 的 意料 ， 对 于 习惯 了 面 癌 对象 思 
维 的 Java 程 序 员 会 觉得 这 是 完全 理所当然 的 。 现 在 的 问题 还 是 和 前 面 的 
一 样 ， 虚 拟 机 是 如 何 知 道 要 调用 哪个 方法 的 ? 











显然 这 里 不 可 能 再 根据 静态 类 型 来 决定 ， 因 为 静态 类 型 同样 都 是 
Human 的 两 个 变量 man 和 woman 在 调用 sayHello0 方 法 时 执行 了 不 同 的 行 
为 ， 并 且 变 量 man 在 两 次 调用 中 执行 了 不 同 的 方法 。 导 致 这 个 现象 的 原 
因 很 明显 ， 是 这 两 个 变量 的 实际 类 型 不 同 ，Java 虚 拟 机 是 如 何 根据 实际 
类 型 来 分 派 方法 执行 版 本 的 呢 ? 我 们 使 用 javap 命 令 输出 这 段 代码 的 字 市 
码 ， 答 试 从 中 寻找 答案 ， 输 出 结果 如 代码 清单 8-9 所 示 。 














代码 清单 8-9_ main0) 方 法 的 字 节 三 





public static void main (java.lang.String[]):; 
Code: 





Stack=2, Locals=3, Args size=1 
0:new#16; //class org/fenixsoft/polymorphic/Dynamic-— 
Dispatch SMan 























3:dup 
4:invokespecial#18; //Method org/fenixsoft/polymorphic/Dynamic- 
Dispatch SMan."<init>":()V 


Tastore: 

8:new#19; //class org/fenixsoft/polymorphic/Dynamic-— 
Dispatch SNWoman 

11:dup 

12:invokespecial#21; //Method 
org/fenixsoft/polymorphic/DynamicDispa 


























tch S$Woman."=<=init>": ()V 

1l15:astore 2 

1l6:aload 1 

17:invokevirtual#22; //Method org/fenixsoft/polymorphic/Dynamic-— 











Dispatch S$Human.sayHello: ()V 

20:aload 2 

21:invokevirtual#22; //Method org/fenixsoft/polymorphic/Dynamic-— 
Dispatch S$Human.sayHello: ()V 

24:new#19; //class org/fenixsoft/polymorphic/Dynamic-— 

Dispatch SNWoman 
































27:dup 

28:invokespecial#21; //Method org/fenixsoft/polymorphic/Dynam 
ijcDispatch S$Woman."<init>": ()V 

3 dst OEe 

32:aloaqd 1 











33:invokevirtual#22; //Method org/fenixsoft/polymorphic/ 
DynamicDispatch S$Human.sayHello: ()V 
36:return 








0~15 行 的 字 节 码 是 准备 动作 ， 作 用 是 建 Yman 和 woman 的 内 存 空 
间 、 调 用 Man 和 Woman 类 型 的 实例 构造 器 ， 将 这 两 个 实例 的 引用 存放 在 
第 1、2 个 局 部 变量 表 Slot 之 中 ， 这 个 动作 也 就 对 应 了 代码 中 的 这 两 句 : 





Human man=new Man ( ) ; 
Human woman=new Woman ( ) ; 





接 下 来 的 16~21 句 是 关键 部 分 ，16、20 两 句 分 别 把 刚刚 创建 的 两 个 


对 象 的 引用 压 到 栈 顶 ， 这 两 个 对 象 是 将 要 执行 的 sayHello() 方 法 的 所 有 
者 ， 称 为 接收 者 〈Receiver) ; 17 和 21 句 是 方法 调用 指令 ， 这 两 条 调用 
指令 单 从 字 节 码 角 度 来 看 ， 无 论 是 指令 〈 都 是 invokevirtual) 还 是 参数 
(都 是 常量 池 中 第 22 项 的 常量 ， 注 释 显 示 了 这 个 常量 是 
Human.sayHello0 的 符号 引用 ) 完全 一 样 的 ， 但 是 这 两 句 指令 最 终 执行 
的 目标 方法 并 不 相同 。 原 因 就 需要 从 invokevirtual 指 令 的 多 态 查 找 过 程 
开始 说 起 ，invokevirtual 指 令 的 运行 时 解析 过 程 大 致 分 为 以 下 几 个 步 








1) 找到 操作 数 栈 顶 的 第 一 个 元 素 所 指 加 的 对 象 的 实际 类 型 ， 记 作 


2) 如 果 在 类 型 C 中 找到 与 常量 中 的 描述 符 和 简单 名 称 都 相符 的 方 
法 ， 则 进行 访问 权限 校 验 ， 如 果 通 过 则 返回 这 个 方法 的 直接 引用 ， 查 找 


过 程 结 束 ; 如 果 不 通 过 ， 则 返回 java.lang.IllegalAccessError 异 常 。 








3) 否则 ， 按 照 继 承 关 系 从 下 往 上 依次 对 C 的 各 个 父 类 进行 第 2 步 的 
搜索 和 验证 过 程 。 


4) 如 果 始 终 没有 找到 合适 的 方法 ， 则 抛 出 


java.lang.AbstractMethodError 异 第 。 


由 于 invokevirtual 指 令 执 行 的 第 一 步 束 是 在 运行 期 确定 接收 者 的 实 
际 类 型 ， 所 以 两 次 调用 中 的 invokevirtual 指 令 把 常量 池 中 的 类 方法 符号 





引用 解析 a 到 了 不 同 的 直接 引用 上 ， 这 个 过 程 就 是 Java 语 言 中 方法 重 写 的 
本 质 。 我 们 把 这 种 在 运行 期 根据 实际 类 型 确定 方法 执行 版 本 的 分 派 过 程 
称 为 动态 分 派 。 








3. 单 分 派 与 多 分 派 





方法 的 接收 者 与 方法 的 参数 统称 为 方法 的 宗 量 ， 这 个 定义 最 早 应 该 
来 源 于 《Java 与 模式 》 一 书 。 根 据 分 派 基于 多 少 种 宗 量 ， 可 以 将 分 派 划 
分 为 单 分 派 和 多 分 派 两 种 。 单 分 派 是 根据 一 个 守 量 对 目标 方法 进行 选 
择 ， 多 分 派 则 是 根据 多 于 一 个 宗 量 对 目标 方法 进行 选择 。 








单 分 派 和 多 分 派 的 定义 读 起 来 抛 口 ， 从 字面 上 看 也 比较 抽象 ， 不 过 
对 照 着 实例 看 整 不 难 理解 了 。 代 码 清单 8-10 中 列举 了 一 个 Father 和 Son 一 
起 来 做 出 “一 个 艰难 的 决定 ”的 例子 。 


代码 清单 8-10 ” 单 分 派 和 多 分 派 





/* 党 

* 单 分 派 、 多 分 派 演示 
Qauthor zzm 

4 
ublic class Dispatcht{ 

tatic class QO{} 

tatic class 360{} 

ublic static class Fathert{ 

public void hardChoice (QQ arg) 1 
System.out.println ("father choose qq"); 
} 

public void hardChoice ( 360 arg) 1 
System.out.println ("father choose 360") ; 
} 

} 

















mo 0 SD 
































public static class Son extends Fathert 
public void hardChoice (QQ arg) 1 
System.out.println ("son choose qq"); 

} 

public void hardChoice ( 360 arg) 1 
System.out.println ("son choose 360") ; 
} 

} 

public static void main (String[]args) 1 
Father father=new Father () ; 

Father son=new Son () ; 

Father.hardChoice (new 360()); 
son.hardChoice (new QQ() ) ; 

} 

} 



































运行 结果 : 








father choose 360 
son choose qq 





在 main 函 数 中 调用 了 两 次 hardChoice() 方 法 ， 这 两 次 hardChoice0) 方 
法 的 选择 结果 在 程序 输出 中 已 经 显示 得 很 清楚 了 。 








我 们 来 看 看 编译 阶段 编译 器 的 选择 过 程 ， 也 就 是 静态 分 派 的 过 程 。 
这 时 选择 目标 方法 的 依据 有 两 点 : 一 是 静态 类 型 是 Father 还 是 Son， 二 是 
方法 参数 是 QQ 还 是 360。 这 次 选择 结果 的 最 终 产物 是 产生 了 两 条 
invokevirtual 指 令 ， 两 条 指令 的 参数 分 别 为 常量 池 中 指向 
Father.hardChoice (360〉 及 Father.hardChoice (QQ ) 方法 的 符号 引用 。 
因为 是 根据 两 个 宗 量 进行 选择 ， 所 以 Java 语 言 的 静态 分 派 属 于 多 分 派 类 
型 。 























再 看 看 运行 阶段 虚拟 机 的 选择 ， 也 就 是 动态 分 派 的 过 程 。 在 执 
行 "son.hardChoice (new QQO) "这 名 代码 时 ， 更 准确 地 说 ， 是 在 执行 这 
句 代码 所 对 应 的 invokevirtual 指 令 时 ， 由 于 编译 期 已 经 决定 目标 方法 的 
签名 必须 为 hardChoice QQ) ， 虚 拟 机 此 时 不 会 关心 传递 过 来 的 参 
数 "QQ" 到 底 是 “腾讯 QQ” 还 是 “奇瑞 QQ”， 因 为 这 时 参数 的 静态 类 型 、 实 
际 类 型 都 对 方法 的 选择 不 会 构成 任何 影响 ， 唯 一 可 以 影响 虚拟 机 选择 的 
因素 只 有 此 方法 的 接受 者 的 实际 类 型 是 Father 还 是 Son。 因 为 只 有 一 个 宗 
量 作为 选择 依据 ， 所 以 Java 语 言 的 动态 分 派 属于 单 分 派 类 型 。 





根据 上 述 论证 的 结果 ， 我 们 可 以 总 结 一 句 : 今天 〈 直 至 还 未 发 布 的 
Java 1.8) 的 Java 语 言 是 一 门 静 态 多 分 派 、 动 态 里 分 派 的 语言 。 强 调 “ 今 
天 的 Java 语 言 ” 是 因为 这 个 结论 未 必 会 恒久 不 变 ，C# 在 3.0 及 之 前 的 版 本 
与 Java 一 样 是 动态 和 捍 分 派 语言 ， 但 在 C#4.0 中 引入 了 dynamic 类 型 后 ， 就 


可 以 很 方便 地 实现 动态 多 分 派 。 








按照 目前 Java 语 言 的 发 展 趋势 ， 它 并 没有 直接 变 为 动态 语言 的 迹 
象 ， 而 是 通过 内 置 动态 语言 (如 JavaScript) 执行 引擎 的 方式 来 满足 动态 
性 的 需求 。 但 是 Java 虚 拟 机 层面 上 则 不 是 如 此 ， 在 JDK 1.7 中 实现 的 JSR- 
292l4 里 面 就 已 经 开始 提供 对 动态 语言 的 支持 了 ，JDK 1.7 中 新 增 的 
invokedynamic 指 令 也 成 为 了 最 复杂 的 一 条 方法 调用 的 字 节 码 指令 ， 稍 后 
笔者 将 专门 讲解 这 个 JDK 1.7 的 新 特性 。 








4. 虚 拟 机 动态 分 派 的 实现 


前 面 介绍 的 分 派 过 程 ， 作 为 对 虚拟 机 概念 模型 的 解析 基本 上 已 经 足 
够 了 ， 它 已 经 解决 了 虚拟 机 在 分 派 中 “会 做 什么 ”这 个 问题 。 但 是 虚拟 
机 “具体 是 如 何 做 到 的 "， 可 能 各 种 虚拟 机 的 实现 都 会 有 些 差 别 。 


由 于 动态 分 派 是 非常 频繁 的 动作 ， 而 且 动 态 分 派 的 方法 版 本 选择 过 
程 需要 运行 时 在 类 的 方法 元 数据 中 搜索 合适 的 目标 方法 ， 因 此 在 虚拟 机 
的 实际 实现 中 基于 性 能 的 考虑 ， 大 部 分 实现 都 不 会 真正 地 进行 如 此 频繁 
的 搜索 。 面 对 这 种 情况 ， 最 常用 的 “稳定 优化 ”手段 就 是 为 类 在 方法 区 中 
建立 一 个 虚 方法 表 (Vritual Method Table， 也 称 为 vtable， 与 此 对 应 的 ， 
在 invokeinterface 执 行 时 也 会 用 到 接口 方法 表 
Table， 简 称 itable) ， 使 用 虚 方法 表 索 引 来 代替 元 数据 查找 以 提高 性 
上。 我 们 先 看 看 代码 清单 8-10 所 对 应 的 虚 方法 表 结 构 示 例 ， 如 图 8-3 所 
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图 8-3 方法 表 结 构 


虚 方法 表 中 存放 着 各 个 方法 的 实际 入 口 地 址 。 如 果 某 个 方法 在 子 类 
中 没有 被 重 写 ， 那 子 类 的 虚 方法 表 里 面 的 地 址 入 口 和 父 类 相同 方法 的 地 
址 入 口 是 一 致 的 ， 都 指向 父 类 的 实现 入 口 。 如 果子 类 中 重 写 了 这 个 方 
法 ， 子 类 方法 表 中 的 地 址 将 会 蔡 换 为 指向 子 类 实现 版 本 的 入 口 地 址 。 图 
8-3 中 ，Son 重 写 了 来 自 Father 的 全 部 方法 ， 因 此 Son 的 方法 表 没 有 指 回 
Father 类 型 数据 的 箭头 。 但 是 Son 和 Father 都 没有 重 写 来 自 Object 的 方 
法 ， 所 以 它们 的 方法 表 中 所 有 从 Object 继承 来 的 方法 都 指向 了 Object 的 
数据 类 型 。 





为 了 程序 实现 上 的 方便 ， 具 有 相同 签名 的 方法 ， 在 父 类 、 子 类 的 虚 
方法 表 中 都 应 当 具 有 一 样 的 索引 序 写 ， 这 样 当 类 型 变换 时 ， 仪 需要 变更 
查找 的 方法 表 ， 就 可 以 从 不 同 的 虚 方法 表 中 按 索 引 转换 出 所 需 的 入 口 地 
Ts 











方法 表 一 般 在 类 加 载 的 连接 阶段 进行 初始 化 ， 准 备 了 类 的 变量 初始 
值 后 ， 虚 拟 机 会 把 该 类 的 方法 表 也 初始 化 完毕 。 


上 文中 笔者 说 方法 表 是 分 派 调 用 的 “稳定 优化 ”手段 ， 虚 拟 机 除了 使 
用 方法 表 之 外 ， 在 条 件 允 许 的 情况 下 ， 还 会 使 用 内 联 缓存 (Inline 
Cache) 和 基于 “类 型 继承 关系 分 析 ”(Class Hierarchy Analysis,CHA) 技 
术 的 守护 内 联 (Guarded Inlining ) 两 种 非 稳定 的 “激进 优化 手段 来 获得 
更 高 的 性 能 ， 关 于 这 两 种 优化 技术 的 原理 和 运作 过 程 ， 读 者 可 以 参考 本 
书 第 11 章 中 的 相关 内 容 。 





四 严格 来 说 ，Dispatch 这 个 词 一 般 不 用 在 静态 环境 之 中 ， 英 文 技术 文档 
的 称呼 是 "Method Ovetload Resolution", 但 国内 的 各 种 资料 都 普遍 将 这 种 
行为 翻译 成 “静态 分 派 、， 特 此 说 明 。 

D] 重 载 中 选择 最 合适 方法 的 过 程 ， 可 参见 Java 语 言 规范 的 $ 15.12.2.5 
Choosing the Most Specific Method 章 节 。 

D3] 有 一 种 观点 认为 : 因为 重 载 是 静态 的 ， 重 写 是 动态 的 ， 所 以 只 有 重 写 
算是 多 态 性 的 体现 ， 重 载 不 算 多 态 。 笔 者 认为 这 种 争论 没有 意义 ， 概 念 

忆 


仅仅 是 说 明 问 题 的 一 种 工具 而 


O 


[4]JSR-292: Supporting Dynamically ‘Typed Laneuages on the Java 


Platform (Java 平 台 的 动态 语言 支持 ) 。 


8.3.3 ”动态 类 型 语言 支持 


Java 虚 拟 机 的 字 节 人 码 指令 集 的 数量 从 Sun 公 司 的 第 一 球 Java 虚 拟 机 问 
世 至 JDK 7 来 临 之 前 的 十 余年 时 间 里 ， 一 直 没 有 发 生 任何 变化 。 随 着 
JDK 7 的 发 布 ， 字 节 码 指令 集 终于 迎 来 了 第 一 位 新 成 员 一 一 


invokedynamic 指 令 。 这 条 新 增加 的 指令 是 JDK 7 实现 “动态 类 型 语 





言 ”(Dynamically Typed Language) 支持 而 进行 的 改进 之 一 ， 也 是 为 
JDK 8 可 以 顺利 实现 Lambda 表 达 式 做 技术 准备 。 在 本 节 中 ， 我 们 将 详细 
讲解 JDK 7 这 项 新 特性 出 现 的 前 因 后 果 和 它 的 深远 意义 。 


1. 动 态 类 型 语言 


在 介绍 Java 虚 拟 机 的 动态 类 型 语言 支持 之 前 ， 我 们 要 先 弄 明白 动态 
类 型 语言 是 什么 ? 它 与 Java 语 言 、Java 虚 拟 机 有 什么 关系 ? 了 解 JDK 1.7 
提供 动态 类 型 语言 支持 的 技术 背景 ， 对 理解 这 个 语言 特性 是 很 有 必要 


的 。 








什么 是 动态 类 型 语言 由 ? 动态 类 型 语言 的 关键 特征 是 它 的 类 型 检查 
的 主体 过 程 是 在 运行 期 而 不 是 编译 期 ， 满 足 这 个 特征 的 语言 有 很 多 ， 禹 


用 的 包括 : APL、Clojure、Erlang、Groovy、JavaScript、Jython、 











Lisp、Lua、PHP、Prolog、Python、Ruby、Smalltalk 和 Tal 等 。 相 对 的 ， 


在 编译 期 就 进行 类 型 检查 过 程 的 语言 《如 C++ 和 Java 等 ) 就 是 最 第 用 的 


静态 类 型 语 肯 o 


觉得 上 面 定 义 过 于 概念 化 ? 那 我 们 不 妨 通过 两 个 例子 以 最 浅显 的 方 
式 来 说 明 什 么 是 “在 编译 期 /运行 期 进行 "和 什么 是 “类 型 检查 ”"。 首 先 看 下 
面 这 上 段 简单 的 Java 代 人 码 ， 它 是 否 能 正常 编译 和 运行 ? 























public static void main (String[]args) 1 
int[][] [larray=new int[1][0][-1]; 
} 





这 段 代 码 能 够 正常 编译 ， 但 运行 的 时 候 会 报 
NegativeArraySizeException 异 常 。 在 Java 虚 拟 机 规范 中 明确 规定 了 
nt nnn ti 时 异常 ， 通 俗 一 点 来 说 ， 运 行 时 

常 就 是 只 要 代码 不 运行 到 这 一 行 就 不 会 有 问题 。 与 运行 时 异常 相对 应 
的 是 连接 时 异常 ， 例 如 很 常见 的 NoClassDefFoundError 便 属于 连接 时 异 
常 ， 即 使 会 导致 连接 时 异常 的 代码 放 在 一 条 无 法 执行 到 的 分 支 路 径 上 ， 
类 加 载 时 (Java 的 连接 过 程 不 在 编译 阶段 ， 而 在 类 加 载 阶段 ， 也 照样 会 
抛 出 异常 








不 过 ， 在 C 语 言 中 ， 含 义 相同 的 代码 会 在 编译 期 报错 : 





int main (void) 1 
int [1] [0] [-1]; //GCC 拒 绝 编 译 ， 报 "size of array is negative" 
return 0; 





























由 此 看 来 ， 一 门 语言 的 哪 一 种 检查 行为 要 在 运行 期 进行 ， 哪 一 种 检 


碍 要 在 编 详 期 进行 并 没有 必然 的 因果 逻辑 关系 ， 关 键 是 语言 规范 中 人 为 
规定 的 。 再 举 一 个 例子 来 解释 “类 型 检查 ”， 例 如 下 面 这 一 句 非常 简单 的 
代码 : 





obj.println ("hello world").; 





虽然 每 个 人 都 能 看 懂 这 行 代码 要 做 什么 ， 但 对 于 计算 机 来 说 ， 这 一 
行 代码 “ 没 尖 没 尾 ”是 无 法 执行 的 ， 它 需要 一 个 具体 的 上 下 文才 有 讨论 的 


现在 假设 这 行 代码 是 在 Java 语 言 中 ， 并 且 变 量 obj 的 静态 类 型 为 
java.io.PrintStream， 那 变量 obj 的 实际 类 型 就 必须 是 PrintStream 的 子 类 
(实现 了 PrintStream 接 口 的 类 ) 才 是 合法 的 。 人 否则 ， 哪 但 obj 属 于 一 个 确 
实 有 用 println (String) 方法 ， 但 与 PrintStream 接 口 没 有 继承 关系 ， 代 码 
依然 不 可 能 运行 一 一 因为 类 型 检查 不 合法 。 


但 是 相同 的 代码 在 ECMAScript (JavaScript) 中 情况 则 不 一 样 ， 无 
论 obj 有 具体 是 何 种 类 型 ， 只 要 这 种 类 型 的 定义 中 确实 包含 有 
println (String) 方法 ， 那 方法 调用 便 可 成 功 。 








这 种 差别 产生 的 原因 是 Java 语 言 在 编译 期 间 已 将 printn (String) 方 
法 完整 的 符号 引用 〈 本 例 中 为 一 个 CONSTANT _InterfaceMethodref info 
和 常量) 生成 出 来 ， 作 为 方法 调用 指令 的 参数 存储 到 Class 文 件 中 ， 例 如 下 


面 这 段 代 码 : 





invokevirtual#4; //Method java/io/PrintStream.Println : 
(Ljava/lang/String; )V 








这 个 符号 引用 包含 了 此 方法 定义 在 哪个 具体 类 型 之 中 、 方 法 的 名 字 
以 及 参数 顺序 、 参 数 类 型 和 方法 返回 值 等 信息 ， 通 过 这 个 符号 引用 ， 虚 
拟 机 可 以 翻译 出 这 个 方法 的 直接 引用 。 而 在 ECMAScript 等 动态 类 型 语 
言 中 ， 变 量 obj 本 身 是 没有 类 型 的 ， 变 量 obj 的 值 才 具有 类 型 ， 编 译 时 最 
多 只 能 确定 方法 名 称 、 参 数 、 返 回 值 这些 信 息 ， 而 不 会 去 确定 方法 所 在 
的 具体 类 型 〈 即 方法 接收 者 不 固定 ) 。“ 变 量 无 类 型 而 变量 值 才 有 类 


型 ”> 这 个 特点 也 是 动态 类 型 语言 的 一 个 重要 特征 。 





了 解 了 动态 和 静态 类 型 语言 的 区 别 后 ， 也 许 读者 的 下 一 个 问题 就 是 
动态 、 静 态 类 型 语言 两 者 谁 更 好 ， 或 者 谁 更 加 先进 ? 这 种 比较 不 会 有 确 
切 答案 ， 因 为 它们 都 有 目 己 的 优点 ， 选 择 哪 种 语言 是 需要 经 过 权衡 的 。 
静态 类 型 语言 在 编译 期 确定 类 型 ， 最 显赫 的 好 处 是 编译 器 可 以 提供 严谨 
的 类 型 检查 ， 这 样 与 类 型 相关 的 问题 能 在 编码 的 时 候 就 及 时 发 现 ， 利 于 
稳定 性 及 代码 达到 更 大 规模 。 而 动态 类 型 语言 在 运行 期 确定 类 型 ， 这 可 
以 为 开发 人 员 提 供 更 大 的 灵活 性 ， 茶 些 在 静态 类 型 语言 中 需 用 大 量 “ 腾 
肿 ? 代 码 来 实现 的 功能 ， 由 动态 类 型 语言 来 实现 可 能 会 更 加 清晰 和 简 
洁 ， 清 晰 和 简洁 通常 也 束 意 味 着 开 友 效率 的 提升。 




















2.JDK 1.7 与 动态 类 型 


回 到 本 节 的 主题 ， 来 看 看 Java 语 言 、 虚 拟 机 与 动态 类 型 语言 之 间 有 
什么 关系 。Java 虚 拟 机 毫 无 疑问 是 Java 语 言 的 运行 平台 ， 但 它 的 使 命 并 
不 仅 限于 此 ， 早 在 1997 年 出 版 的 《Java 虚 拟 机 规范 》 中 就 规划 了 这 样 一 
个 愿景 ;“ 在 未 来 ， 我 们 会 对 Java 虚 拟 机 进行 适当 的 扩展 ， 以 便 更 好 地 
支持 其 他 语言 运行 于 Java 虚 拟 机 之 上 ”。 而 目前 确实 已 经 有 许多 动态 类 
型 语言 运行 于 Java 虚 拟 机 之 上 了 ， 如 Clojure、Groovy、Jython 和 JRuby 
等 ， 能 够 在 同一 个 虚拟 机 上 可 以 达到 静态 类 型 语言 的 严谨 性 与 动态 类 型 
语言 的 灵活 性 ， 这 是 一 件 很 美妙 的 事情 。 








但 遗憾 的 是 ，Java 虚 拟 机 层面 对 动态 类 型 语言 的 支持 一 直 都 有 所 欠 
缺 ， 主 要 表现 在 方法 调用 方面 : JDK 1.7 以 前 的 字 节 码 指令 集中 ，4 条 方 
法 调用 指令 (invokevirtual、invokespecial、invokestatic、 
invokeinterface) 的 第 一 个 参数 都 是 被 调用 的 方法 的 符号 引用 
(CONSTANT Methodref info 或 者 CONSTANT InterfaceMethodref info 
常量 ) ， 前 面 已 经 提 到 过 ， 方 法 的 符号 引用 在 编译 时 产生 ， 而 动态 类 型 
语言 只 有 在 运行 期 才能 确定 接收 者 类 型 。 这 样 ， 在 Java 虚 拟 机 上 实现 的 
动态 类 型 语言 就 不 得 不 使 用 其 他 方式 《如 编译 时 留 个 占 位 符 类 型 ， 运 行 
时 动态 生成 字 节 人 码 实现 具体 类 型 到 占 位 符 类 型 的 适 配 ) 来 实现 ， 这 样 势 
必 让 动态 类 型 语言 实现 的 复杂 上 度 增加 ， 也 可 能 带 来 额外 的 性 能 或 者 内 存 
开销 。 尽 管 可 以 利用 一 些 办 法 〈 如 Call Site Caching) 让 这 些 开 销 尽 量变 
小 ， 但 这 种 底层 问题 终归 是 应 当 在 虚拟 机 层次 上 去 解决 才 最 合适 ， 因 此 

















在 Java 虚 拟 机 层面 上 提供 动态 类 型 的 直接 文 持 束 成 为 了 Java 平 台 的 发 展 
趋势 之 一 ， 这 就 是 JDK 1.7 (JSR-292) 中 invokedynamic 指 令 以 及 
java.lang.invoke 包 出 现 的 技术 背景 。 


3.java.lang.invoke 包 


JDK 1.7 实 现 了 JSR-292， 新 加 入 的 java.lang.invoke 包 “就 是 JSR-292 
的 一 个 重要 组 成 部 分 ， 这 个 包 的 主要 目的 是 在 之 前 单纯 依靠 符号 引用 来 
确定 调用 的 目标 方法 这 种 方式 以 外 ， 提 供 一 种 新 的 动态 确定 目标 方法 的 
机 制 ， 称 为 MethodHandle。 这 种 表达 方式 也 许 不 太 好 异 ? 那 不妨 把 
MethodHandle 与 C/C++ 中 的 Function Pointer， 或 者 C# 里 面 的 Delegate 类 比 
一 下 。 举 个 例子 ， 如 果 我 们 要 实现 一 个 带 谓词 的 排序 函数 ， 在 C/C++ 中 
常用 的 做 法 是 把 谓词 定义 为 函数 ， 用 函数 指针 把 谓词 传递 到 排序 方法 ， 
如 下 : 














void sort (int list[], const int size,int (xcompare) (int,int) ) 





但 Java 语 言 做 不 到 这 一 点 ， 即 没有 办 法 单独 地 把 一 个 函数 作为 参数 
进行 传递 。 普 裔 的 做 法 是 设计 一 个 带 有 compare() 方 法 的 Comparator 接 
口 ， 以 实现 了 这 个 接口 的 对 象 作为 参数 ， 例 如 Collections.sort() 就 是 这 样 
定义 的 : 











void sort (List list,Comparator c) 








不 过 ， 在 拥有 Method Handle 之 后 ，Java 语 言 也 可 以 拥有 类 似 于 函数 





指针 或 者 委托 的 方法 别名 的 工具 了 。 代 码 清单 8-11 演 示 了 MethodHandle 
的 基本 用 途 ， 无 论 obj 是 何 种 类 型 〈 临 时 定义 的 ClassA 抑 或 是 实现 
PrintStream 接 口 的 实现 类 System.out) ， 都 可 以 正确 地 调用 到 println() 方 





代码 清单 8-11 MethodHandle 演 示 





jmport 





static java.lang.invoke.MethodHandles.lookup:; 


ijmport java.lang.invoke.MethodHandle:; 


jmport 


/** 


-joR=2902 


*Qauthor zzm 


4 


public class 
Static Class 
public void println (String s) 1 
System.out.println (sS) ; 


} 
} 


public 

















java.lang.invoke.MethodType:; 








Method Handle 基 础 用 法 演示 





MethodHandleTest{ 
ClassAt{ 








static void main (String[]args) throws Throwablef 





Object obj=System.currentTimeMillis()%$2==0?System.out:new 
ClassA (); 

/* 无 论 opj 最 终 是 哪个 实现 类 ， 下 面 这 人 句 都 能 正确 调用 到 print1lin 方 法 

getPrintlnMH (obj) .invokeExact ("icyfenix").; 


} 



































private static MethodHandle getPrintlnMH (Object reveiver) throws 
Throwablet{ 
/*MethodType: 代表 \ 方 法 类 型 “， 包 含 了 方法 的 返回 值 (methodType () 的 第 一 个 参 


数 ) 和 


Me 





具体 参数 (me 
thodType mi 








thodType () 第 二 个 及 以 后 的 参数 ) */ 
t=MethodType.methodType (void.class,String.class); 





/*lookup () 方法 来 自 于 MethodHandles .lookup， 这 人 句 的 作用 是 在 指定 类 中 查找 符合 
给 定 的 方法 名 称 、 方 法 类 型 ， 并 且 符 合 调 用 权限 的 方法 句柄 */ 


/* 

















因为 这 里 调用 的 是 一 个 虚 方 法 ， 按 照 Java 语 言 的 规则 ， 方 法 第 一 个 参数 是 隐 式 的 ， 代 表 








该 方法 的 接收 者 ， 也 即 是 thi s 指 向 的 对 象 ， 这 个 参数 以 前 是 放 在 参数 列表 中 进行 传递 的 ， 而 现 
在 提供 了 bindTo () 方法 来 完成 这 件 事 情 */ 


Ee 














turn lookup() .findVirtual (reveiver.getClass(), "println", 





mt) .bindTo (reveiver).; 





实际 上 ， 方 法 getPrinttnMHO 中 模拟 了 invokevirtual 指 令 的 执行 过 
程 ， 只 不 过 它 的 分 派 逻 辑 并 非 固化 在 Class 文 件 的 字 节 码 上 ， 而 是 通过 
个 具体 方法 来 实现 。 而 这 个 方法 本 里 的 返回 值 (MethodHandle 对 象 ) ， 
可 以 视 为 对 最 终 调用 方法 的 一 个 “引用 ”。 以 此 为 基础 ， 有 了 
MethodHandle 就 可 以 写 出 类 似 于 下 面 这 样 的 函数 声明 : 














void sort (List list,MethodHandle compare) 








从 上 面 的 例子 可 以 看 出 ， 使 用 MethodHandle 并 没有 什么 困难 ， 不 过 
看 完 它 的 用 法 之 后 ， 读 者 大 概 束 会 产生 疑问 ， 相 同 的 事情 ， 用 反射 不 是 
早 就 可 以 实现 了 吗 ? 


确实 ， 仅 站 在 Java 语 言 的 角度 来 看 ，MethodHandle 的 使 用 方法 和 效 
果 与 Reflection 有 众多 相似 之 处 ， 不 过 ， 它 们 还 是 有 以 下 这 些 区 别 : 


从 本 质 上 讲 ，Reflection 和 MethodHandle 机 制 都 是 在 模拟 方法 调用 ， 
但 Reflection 是 在 模拟 Java 代 码 层次 的 方法 调用 ， 而 MethodHandle 是 在 模 
拟 字 节 码 层次 的 方法 调用 。 在 MethodHandles.lookup 中 的 3 个 方法 一 一 
findStatic()、findVirtual()、findSpecial0 正 是 为 了 对 应 于 invokestatic、 





invokevirtual & invokeinterface 和 invokespecial 这 几 条 字 节 码 指令 的 执行 权 
限 校 验 行为 ， 而 这 些 底层 细节 在 使 用 Reflection API 时 是 不 需要 关心 的 。 


Reflection 中 的 java.lang.reflect.Method 对 象 远 比 MethodHandle 机 制 中 
的 java.lang.invoke.MethodHandle 对 象 所 包含 的 信息 多 。 前 者 是 方法 在 
Java 一 端的 全 面 映 像 ， 包含 了 方法 的 签名 、 描 述 符 以 及 方法 属性 表 中 各 
种 属性 的 Java 端 表示 方式 ， 还 包含 执行 权限 等 的 运行 期 信息 。 而 后 者 仪 
仅 包含 与 执行 该 方法 相关 的 信息 。 用 通俗 的 话 来 讨 ，Reflection 是 重量 


级 ， 而 MethodHandle 是 轻 量 级 。 








由 于 MethodHandle 是 对 字 节 码 的 方法 指令 调用 的 模拟 ， 所 以 理论 上 
虚拟 机 在 这 方面 做 的 各 种 优化 〈 如 方法 内 联 ) ， 在 MethodHandle 上 也 应 
当 可 以 采用 类 似 思 路 去 支持 (但 目前 实现 还 不 完善 ，。 而 通过 反射 去 调 
用 方法 则 不 行 。 





MethodHandle 与 Reflection 除 了 上 面 列 举 的 区 别 外 ， 最 关键 的 一 点 还 
在 于 去 掉 前 面 讨论 施 加 的 前 提 “ 仅 站 在 Java 语 言 的 角度 来 看 ”*: Reflection 
API 的 设计 目标 是 只 为 Java 语 言 服务 的 ， 而 MethodHandle 则 设计 成 可 服 
务 于 所 有 Java 虚 拟 机 之 上 的 语言 ， 其 中 也 包括 Java 语 言 。 


4.invokedynamic 指 令 
本 节 一 开始 就 提 到 了 JDK 1.7 为 了 更 好 地 文 持 动 态 类 型 语言 ， 引 入 
了 第 5 条 方法 调用 的 字 节 人 码 指 令 invokedynamic， 之 后 一 直 没 有 再 提 到 


它 ， 甚 至 把 代码 清单 8-11 中 使 用 MethodHandle 的 示例 代码 反 编 译 后 也 不 
会 看 见 invokedynamic 的 身影 ， 它 的 应 用 之 处 在 哪里 呢 ? 








在 某 种 程度 上 ，invokedynamic 指 令 与 MethodHandle 机 制 的 作用 是 一 
样 的 ， 都 是 为 了 解决 原 有 4 条 "invoke*" 指 令 方法 分 派 规则 固化 在 虚拟 机 
之 中 的 问题 ， 把 如 何 查找 目标 方法 的 决定 权 从 虚拟 机 转嫁 到 具体 用 户 代 
码 之 中 ， 让 用 户 〈 包 含 其 他 语言 的 设计 者 ) 有 更 高 的 自由 度 。 而 且 ， 它 
们 两 者 的 思路 也 是 可 类 比 的 ， 可 以 把 它们 想象 成 为 了 达成 同一 个 目的 ， 
一 个 采用 上 层 Java 代 码 和 API 来 实现 ， 另 一 个 用 字 节 码 和 Class 中 其 他 属 
性 、 第 量 来 完成 。 因 此 ， 如 果 理 解 了 前 面 的 MethodHandle 例 子 ， 那 么 理 
解 invokedynamic 指 令 也 并 不 困难 。 





每 一 处 含有 invokedynamic 指 令 的 位 置 都 称 做 “动态 调用 
点 ”(Dynamic Call Site) ， 这 条 指令 的 第 一 个 参数 不 再 是 代表 方法 符号 


引用 的 CONSTANT_Methodref info 常 量 ， 而 是 变 为 JDK 1.7 新 加 入 的 





CONSTANT _InvokeDynamic_info 常 量 ， 从 这 个 新 常量 中 可 以 得 到 3 项 信 
息 : 引导 方法 (Bootstrap Method， 此 方法 存放 在 新 增 的 
BootstrapMethods 属 性 中 ) 、 方 法 类 型 (MethodType) 和 和 名称 。 引 导 方 
法 是 有 固定 的 参数 ， 并 且 返 回 值 是 java.lang.invoke.CallSite 对 象 ， 这 个 代 
表 真 正 要 执行 的 目标 方法 调用 。 根 据 CONSTANT_InvokeDynamic_info 
常量 中 提供 的 信息 ， 虚 拟 机 可 以 找到 并 且 执 行 引导 方法 ， 从 而 获得 一 个 
CallSite 对 象 ， 最 终 调用 要 执行 的 目标 方法 。 我 们 还 是 举 一 个 实际 的 例 
子 来 解释 这 个 过 程 ， 如 代码 清单 8-12 所 示 。 





代码 清单 8-12 invokedynamic 指 令 演 示 





















































ijmport static java. lang.invoke.MethodHandqles .ookup; 
import java.lang.invoke.CcallSite:; 

ijmport java.lang.invoke.ConstantCallSite:; 

import java.lang.invoke.MethodHandle:; 

import java.lang.invoke.MethodHandles; 

Import java.lang.invoke.MethodType:; 

public class InvokeDynamicTest{ 

public static void main (String[]args) throws Throwablef{ 
INDY BootstrapMethod() .invokeFExact ("icyfenix"); 

} 

public static void testMethod (String s) 1 


System.out .print] 


} 








public si 


tatic Cal 


In ("hel 


lSite 











L1o String:"+s); 


BootstrapMethod (MethodHandles .Lookup 


lookup, String name, MethodType mt) throws Throwablelf 
return new 


ConstantCallSite (Lookup .| 


lookup () .: 
_BootstrapMet 


MT 


} 


private si 
return Met 
.fromMethodDescriptorString ( 











tatic MethodType MT 
thodType 








FindSstatic (InvokeDynamicTest.class,name,mt) . 


BootstrapMethod()f{ 


" (Lijava/lang/invoke/MethodHandles S$Lookup; Ljava/lang/String; 
Ljava/lang/invoke/MethodType; ) Liava/lang/invoke/CallSite; ", 


null); 
} 


private static MethodHandle MH ] 


return 











} 


private static MethodHandle 


Throwablet 
CallSite cs= (CallSite) 


MH 





MethodType.1 
null) 
return cs.dynamic] 


) ; 





} 
} 


Finds 








ECG 
thod()); 











[nvokeDynamicTest.class, 


INDY 


BootstrapMethod()throws Throwablel{ 








"BootstrapMethod", 


BootstrapMethod() throws 











[nvoker () ; 


BootstrapMethod() .invokeWithArguments (lookup(), "testMethod", 
fromMethodDescriptorString (" (Lijava/lang/String; ) V", 





这 段 代码 与 前 面 MethodHandleTest 的 作用 基本 上 是 一 样 的 ， 虽 然 笔 
者 没有 加 以 注释 ， 但 是 阅读 起 来 应 当 不 困难 。 本 书 前面 提 到 过 ， 由 于 


invokedynamic 指 令 所 面 同 的 使 用 者 并 非 Java 语 言 ， 而 是 其 他 Java 虚 拟 机 
之 上 的 动态 语言 ， 因 此 仪 依靠 Java 语 言 的 编译 器 Javac 没 有 办 法 生成 带 有 
invokedynamic 指 令 的 字 节 码 ( 曾 经 有 一 个 java.dyn.InvokeDynamic 的 语 
法 糖 可 以 实现 ， 但 后 来 被 取消 了 ) ， 所 以 要 使 用 Java 语 言 来 演示 
invokedynamic 指 令 只 能 用 一 些 变 通 的 办 法 。John Rose (Da Vinci 
Machine Project 的 Leader) 编号 了 一 个 把 程序 的 字 节 码 转换 为 使 用 
invokedynamic 的 简单 工具 INDY 来 完成 这 件 事情 ， 我 们 要 使 用 这 个 工 
具 来 产生 最 终 要 的 字 节 码 ， 因 此 这 个 示例 代码 中 的 方法 名 称 不 能 随意 改 
动 ， 更 不 能 把 几 个 方法 合并 到 一 起 号， 因为 它们 是 要 被 INDY 工 具 读 取 
的 。 








把 上 面 代码 编译 、 再 使 用 INDY 转 换 后 重新 生成 的 字 节 码 如 代码 清 
单 8-13 所 示 《 结 果 使 用 javap 输 出 ， 因 版 面 原 因 ， 精 简 了 许多 无 关 的 内 


容 ) 。 


代码 清单 8-13 ”invokedynamic 指 令 演 示 (2) 





Constant pool: 
#121=NameAndType#33:#30//testMethod: (Ljava/lang/String; )V 
#123=InvokeDynamic#0:#121//#0:testMethod: (Ljava/lang/String; ) V 

public static void main (java.lang.String[]) throws 
java.lang.Throwable; 

Code: 

stack=2, locals=1, args size=] 

0:1qc#23//String abc 

2:invokedynamic#123, 0//InvokeDynamic#0:testMethod: 
(Ljava/lang/String; ) V 

7:nop 

8:return 


























public static java.lang.invoke.CcallSite 





BootstrapMethod (java.lang.invoke.MethodHandles 


$Lookup, java.lang.String,java.lang.invoke.MethodType) throws 


java.lang.Throwable:; 
Code: 
stack=6, locals=3, args s 


ize=3 


0:new#63//class java/lang/invoke/ConstantCallSite 


:dup 
:aload 0 











:ldc#1//class org/fenixsoft/InvokeDynamicTest 





:aload 1 
:aload 2 


co ~] nn 心 WwW 





9:invokevirtual#65//Method java/lang/invoke/MethodHandles 
$Lookup.findSstatic: (Ljava/lang/Class; Ljava/lang/String:; 
Ljava/lang/invoke/MethodType; ) Ljava/lang/invoke/MethodHandle; 








12:invokespecial#71//Method java/lang/invoke/ConstantCallSite."<~ 


in it>": (Ljava/lang/invoke/MethodHandle; ) V 





15 :aretun 





从 main() 方 法 的 字 节 码 可 见 ， 原 本 的 方法 调用 指令 已 经 蔡 换 为 
invokedynamic， 它 的 参数 为 第 123 项 常量 〈 第 二 个 值 为 0 的 参数 在 
HotSpot 中 用 不 到 ， 与 invokeinterface 指 令 那 个 值 为 0 的 参数 一 样 都 是 占 位 


的 ) 。 





2:invokedynamic#123，0//] 
(Lijava/lang/String; ) V 





[nvokeDynamic#0:testMethod: 





从 常量 池 中 可 见 ， 第 123 项 常量 显 


示 '"#123=InvokeDynamic#0:#121" 说 明 它 是 一 项 





CONSTANT_InvokeDynamic_info 类 型 常量 ， 常 量 值 中 前 面 的 #0” 代表 


引导 方法 取 BootstrapMethods 





属性 表 的 第 0 项 (javap 没 有 列 出 属性 表 的 上 


体内 容 ， 不 过 示例 中 仅 有 一 个 引导 方法 ， 即 BootstrapMethodO0) ， 而 后 
面 的 "#121" 代 表 引 用 第 121 项 类 型 为 CONSTANT_NameAndType_info 的 





第 量 ， 从 这 个 第 量 中 可 以 获取 方法 名 称 和 摘 述 符 ， 即 后 面 输出 
的 "testMethod: (Ljava/lang/String; ) V"。 


再 看 一 下 BootstrapMethod0， 这 个 方法 Java 源 码 中 没有 ， 是 INDY 产 
生 的 ， 但 是 它 的 字 节 码 很 容易 读 懂 ， 所 有 逻辑 就 是 调用 MethodHandles 
$Lookup 的 findStatic() 方 法 ， 产 生 testMethod() 方 法 的 MethodHandle， 然 
后 用 它 创 建 一 个 ConstantCallSite 对 象 。 最 后 ， 这 个 对 象 返 回 给 
invokedynamic 指 令 实 现 对 testMethod() 方 法 的 调用 ，invokedynamic 指 令 
的 调用 过 程 到 此 就 宣告 完成 了 。 


5. 掌 控 方 法 分 派 规则 





invokedynamic 指 令 与 前 面 4 条 "invoke*" 指 令 的 最 大 差别 就 是 它 的 分 
派 迎 辑 不 是 由 虚拟 机 决定 的 ， 而 是 由 程序 员 决 定 。 在 介绍 Java 虚 拟 机 动 
态 语言 支持 的 最 后 一 个 小 结 中 ， 笔 者 通过 一 个 简单 例子 (如 代码 清单 8- 
14 所 示 〉， 帮 助 读者 理解 程序 员 在 可 以 掌控 方法 分 派 规 则 之 后 ， 能 做 什 
么 以 前 无 法 做 到 的 事情 。 








代码 清单 8-14 ”方法 调用 问题 





class GrandqFather1{ 

void thinking()t 

System.out.println ("i am grandfather"),; 
} 

} 

class Father extends GrandqFatheri{ 

void thinking() { 
System.out .println ("i am father") ; 














} 

} 

class Son extends Father! 

void thinking() { 

// 请 读者 在 这 里 填 入 适当 的 代码 〈 不 能 修改 其 他 地 方 的 代码 ) 

/ /实现 调用 祖父 类 的 thinking () 方 法 ， 打 印 "三 am grandfather" 
} 

} 
























































在 Java 程 序 中 ， 可 以 通过 "super" 关 键 字 很 方便 地 调用 到 父 类 中 的 方 
法 ， 但 如 果 要 访问 祖 类 的 方法 呢 ? 读 者 在 阅读 本 书 下 和 面 提供 的 解决 方案 
之 前 ， 不 妨 自己 思考 一 下 ， 在 JDK 1.7 之 前 有 没有 办 法 解决 这 个 问题 。 


在 JDK 1.7 之 前 ， 使 用 纯粹 的 Java 语 言 很 难处 理 这 个 问题 (直接 生成 
字 节 码 就 很 简单 ， 如 使 用 ASM 等 字 节 码 工 具 ) ， 原 因 古 在 Son 类 的 
thinkingO 方 法 中 无 法 获取 一 个 实际 类 型 是 GrandFather 的 对 象 引用 ， 而 
invokevirtual 指 令 的 分 小 逻辑 就 是 按照 方法 接收 者 的 实际 类 型 进行 分 
派 ， 这 个 逻辑 是 固化 在 虚拟 机 中 的 ， 程 序 员 无 法 改变 。 在 JDK 1.7 中 ， 
可 以 使 用 代码 清单 8-15 中 的 程序 来 解决 这 个 问题 。 





代码 清单 8-15 ”使 用 MethodHandle 来 解决 相关 问题 





import static java.lang.invoke.MethodHandles.1lookup:; 
ijmport java.lang.invoke.MethodHandle:; 

import java.lang.invoke.MethodType:; 

class Test{ 

Class GrandFathert{ 

void thinking() { 

System.out .println ("i am drandqfather") ; 

} 
} 
class Father extends GrandqFatheri{ 
void thinking() { 





























System.out .println ("i am father") ; 
} 
} 
class Son extends Father! 
void thinking() { 
tryl 
MethodType mt=MethodType.methodType (voidq.class) ; 
MethodHandle 
mh=lookup() .findSpecial (GrandFather.class, "thinking", 
mt,getClass ()); 
mh.invoke (this) : 
}catch (Throwable e) 1 
} 
} 
} 
public static void main (String[]args) 1 
(new Test() .new Son()) .thinking(); 























i am grandfather 





四 注意 ; 动态 类 型 语言 汪 动态 语言 弱 类 型 语言 并 不 是 一 个 人 概念; 需要 


四 这 个 包 在 很 长 一 段 时 间 里 称 为 java.dyn， 也 曾经 短暂 更 名 为 
java.lang.mh， 如 果 读 者 在 其 他 资料 上 看 到 这 两 个 包 名 ， 可 以 把 它们 理解 
为 java.lang.invoke。 

[3JINDY 下 载 地 址 : 


http:/ /blogs.oracle.com/jrose/entry/a_modest_tool_for_wtritingo 


8.4 ”基于 栈 的 字 节 码 解释 执行 引擎 


虚拟 机 是 如 何 调用 方法 的 内 容 已 经 讲解 完毕 ， 从 本 节 开 始 ， 我 们 来 
探讨 虚拟 机 是 如 何 执 行 方法 中 的 字 市 码 指 令 的 。 上 文中 提 到 过 ， 许 多 
Java 虚 拟 机 的 执行 引擎 在 执行 Java 代 人 码 的 时 候 都 有 解释 执行 (通过 解释 
器 执行 ) 和 编译 执行 《通过 即时 编译 器 产生 本 地 代码 执行 ) 两 种 选择 ， 
在 本 章 中 ， 我 们 先 来 探讨 一 下 在 解释 执行 时 ， 虚 拟 机 执行 引擎 是 如 何 工 
作 的 。 


8.4.1 解释 执行 


Java 语 言 经 常 被 人 们 定位 为 “解释 执行 ”的 语言 ， 在 Java 初 生 的 JDK 
1.0 时 代 ， 这 种 定义 还 算是 比较 准确 的 ， 但 当主 流 的 虚拟 机 中 都 包含 了 
即时 编译 器 后 ，Class 文 件 中 的 代码 到 底 会 被 解释 执行 还 是 编译 执行 ， 就 
成 了 只 有 虚拟 机 自己 才能 准确 判断 的 事情 。 再 后 来 ，Java 也 发 展 出 了 可 
以 直接 生成 本 地 代码 的 编译 器 [如 GCJI (GNU Compiler for the 
Java) ]， 而 C/C++ 语言 也 出 现 了 通过 解释 器 执行 的 版 本 (如 CINTL*1)， 
这 时 候 再 笼统 地 说 “解释 执行 ”， 对 于 整个 Java 语 言 来 说 就 成 了 几乎 是 没 

意义 的 概念 ， 只 有 确定 了 谈论 对 象 是 某 种 具体 的 Java 实 现 版 本 和 执行 
引擎 运行 模式 时 ， 谈 解释 执行 还 是 编译 执行 才 会 比较 确切 。 














不 论 是 解释 还 是 编译 ， 也 不 论 是 物理 机 还 是 虚拟 机 ， 对 于 应 用 程 
序 ， 机 器 都 不 可 能 如 人 那样 阅读 、 理 解 ， 然 后 就 获得 了 执行 能 力 。 大 部 
分 的 程序 代码 到 物理 机 的 目标 代码 或 虚拟 机 能 执行 的 指令 集 之 前 ， 都 需 
要 经 过 图 8-4 中 的 各 个 步骤 。 如 采访 者 对 编译 原理 的 相关 课程 还 有 印象 
的 话 ， 很 容易 就 会 及 现 图 8-4 中 下 面 那 条 分 文 ， 束 是 传统 编译 原理 中 程 
序 代 码 到 目标 机 串 代 码 的 生成 过 程 ， 而 中 间 的 那 条 分 文 ， 目 然 驶 是 解释 
执行 的 过 程 。 





如 今 ， 基 于 物理 机 、Java 虚 拟 机 ， 或 者 非 Java 的 其 他 高 级 语言 虚拟 
机 (HLLVM) 的 语言 ， 大 多 都 会 遵循 这 种 基于 现代 经 典 编译 原理 的 思 
路 ， 在 执行 前 先 对 程序 源码 进行 词法 分 析 和 语法 分 析 处 理 ， 把 源码 转化 
为 抽象 语法 树 (Abstract Syntax Tree,AST) 。 对 于 一 门 具 体 语言 的 实现 
来 说 ， 词 法 分 析 、 语 法 分 析 以 至 后 面 的 优化 器 和 目标 代码 生成 器 都 可 以 
选择 独立 于 执行 引擎 ， 形 成 一 个 完整 意义 的 编译 器 去 实现 ， 这 类 代表 是 
C/C++ 语 言 。 也 可 以 选择 把 其 中 一 部 分 步骤 “如 生成 抽象 语法 树 之 前 的 
步骤 ) 实现 为 一 个 半 独 立 的 编译 器 ， 这 类 代表 是 Java 语 言 。 又 或 者 把 这 
些 步骤 和 执行 引擎 全 部 集中 封装 在 一 个 封闭 的 黑匣子 之 中 ， 如 大 多 数 的 
JavaScript 执 行 器 。 


可 选 
. Wi 中 间 代 码 


图 8-4 编译 过 程 





Java 语 言 中 ，Javac 编 译 器 完成 了 程序 代码 经 过 词法 分 析 、 语 法 分 析 
到 抽象 语法 树 ， 再 过 有 历 语 法 树 生 成 线性 的 字 节 码 指令 流 的 过 程 。 因 为 这 
一 部 分 动作 是 在 Java 虚 拟 机 之 外 进行 的 ， 而 解释 器 在 虚拟 机 的 内 部 ， 所 
以 Java 程 序 的 编译 就 是 半 独 立 的 实现 。 








[IJGC]J: http://gcc.gnu.org/java/o 
2]CINT: http://root.cern.ch/drupal/content/cinto 





8.4.2 ”基于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 


Java 编 译 器 输出 的 指令 流 ， 基 本 上 由 是 一 种 基于 栈 的 指令 集 架 构 
(Instruction Set ArchitectureISA) ， 指 令 流 中 的 指令 大 部 分 都 是 零 地 址 
指令 ， 它 们 依赖 操作 数 栈 进行 工作 。 与 之 相对 的 另外 一 套 常 用 的 指令 集 
架构 是 基于 寄存 器 的 指令 集 ， 最 典型 的 就 是 x86 的 二 地 址 指令 集 ， 说 得 
通俗 一 些 ， 就 是 现在 我 们 主流 PC 机 中 直接 支持 的 指令 集 架构 ， 这 些 指 
令 依赖 寄存 器 进行 工作 。 那 么 ， 基 于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 
这 两 者 之 间 有 什么 不 同 呢 ? 











举 个 最 简单 的 例子 ， 分 别 使 用 这 两 种 指令 集 计 算 “1+1” 的 结果 ， 基 
于 栈 的 指令 集会 是 这 样子 的 : 





iconst 1 
iconst 1 
iadqd 

istore 0 











两 条 iconst_1 指 令 连 续 把 两 个 常量 1 压 入 栈 后 ，iadd 指 令 把 栈 顶 的 两 
个 值 出 栈 、 相 加 ， 然 后 把 结果 放 回 栈 顶 ， 最 后 istore_0 把 栈 顶 的 值 放 到 
局 部 变量 表 的 第 0 个 Slot 中 。 


如 果 基 于 寄存 器 ， 那 程序 可 能 会 是 这 个 样子 : 





mov eax, 1 


add eax, 1 


mov 指 令 把 EAX 寄存 器 的 值 设 为 1， 然 后 add 指 令 再 把 这 个 值 加 1， 
结果 就 保存 在 EAX 寄存 器 里 面 。 





了 解 了 基于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 的 区 别 后 ， 读 者 可 能 
会 有 进一步 的 疑问 ， 这 两 套 指 令 集 谁 更 好 一 些 呢 ? 





应 该 这 么 说 ， 既 然 两 套 指令 集会 同时 并 存 和 发 展 ， 那 肯定 是 各 有 优 
势 的 ， 如 果 有 一 套 指令 集 全 面 优 于 力 外 一 套 的 话 ， 就 不 会 存在 选择 的 问 


题 了 。 





基于 栈 的 指令 集 主要 的 优点 就 是 可 移植 ， 寄 存 器 由 硬件 直接 提供 

中 ， 程 序 直接 依赖 这 些 硬 件 寄存 器 则 不 可 避免 地 要 受到 硬件 的 约束 。 例 
如 ， 现 在 32 位 80x86 体 系 的 处 理 器 中 提供 了 8 个 32 位 的 寄存 器 ， 而 ARM 
体系 的 CPU 在 当前 的 手机 、PDA 中 相当 流行 的 一 种 处 理 器 〉 则 提供 了 
16 个 32 位 的 通用 寄存 器 。 如 果 使 用 栈 架构 的 指令 集 ， 用 户 程序 不 会 直接 
使 用 这 些 寄存 器 ， 就 可 以 由 虚拟 机 实现 来 自行 决定 把 一 些 访问 最 频繁 的 
数据 (程序 计数 器 、 栈 顶 缓存 等 ) 放 到 寄存 器 中 以 获取 尽量 好 的 性 能 ， 
这 样 实现 起 来 也 更 加 简单 一 些 。 栈 架构 的 指令 集 还 有 一 些 其 他 的 优点 ， 
如 代码 相对 更 加 紧凑 〈 字 节 码 中 每 个 字 节 就 对 应 一 条 指令 ， 而 多 地 址 指 
令 集中 还 需要 存放 参数 ) 、 编 译 器 实现 更 加 简单 〈 不 需要 考虑 空间 分 配 
的 问题 ， 所 需 空 间 都 在 栈 上 操作 ) 等 。 














栈 如 构 指令 集 的 主要 缺点 是 执行 速度 相对 来 说 会 稍 慢 一 些 。 所 有 主 
流 物理 机 的 指令 集 都 是 寄存 器 殿 构 也 从 侧面 印证 了 这 一 点 。 








里 然 栈 架构 指令 集 的 代码 非常 紧凑 ， 但 是 完成 相同 功能 所 需 的 指令 
数量 一 般 会 比 寄存 器 架构 多 ， 因 为 出 栈 、 入 栈 操作 本 里 束 产生 了 相当 多 
的 指令 数量 。 更 重要 的 是 ， 栈 实现 在 内 存 之 中 ， 频 繁 的 栈 访问 也 残 意味 
独 频 繁 的 内 存 访 问 ， 相 对 于 处 理 圳 来 次， 内存 始终 是 执行 速度 的 瓶颈 。 
尽管 虚拟 机 可 以 采取 栈 顶 缓存 的 手段 ， 把 最 常用 的 操作 映射 到 寄存 器 中 
避免 直接 内 存 访问 ， 但 这 也 只 能 是 优化 措施 而 不 是 解决 本 质问 题 的 方 
法 。 由 于 指令 数量 和 内 存 访 问 的 原因 ， 所 以 导致 了 栈 架 构 指 令 集 的 执行 
速度 会 相对 较 慢 。 








[1] 使 用 “基本 上 ”， 是 因为 部 分 字 节 码 指令 会 带 有 参数 ， 而 纯粹 基于 栈 
的 指令 集 架 构 中 应 当 全 部 都 是 零 地 址 指令 ， 也 就 是 都 不 存在 显 式 的 参 
数 。Java 这 样 实现 主要 是 考虑 了 代码 的 可 校 验 性 。 

这 里 说 的 是 物理 机 器 上 的 寄存 器 ， 也 有 基于 寄存 器 的 虚拟 机 ， 如 
Google Andtroid 平 台 的 Dalvik VM。 即 使 是 基于 寄存 器 的 虚拟 机 ， 也 希望 


把 虚拟 机 寄存 器 尽量 映射 到 物理 寄存 器 上 以 获取 尽 可 能 高 的 性 能 。 


8.4.3 ”基于 栈 的 解释 器 执行 过 程 


初步 的 理论 知识 已 经 讲解 过 了 ， 本 节 准 备 了 一 段 Java 代 码 ， 看 看 在 
虚拟 机 中 实际 是 如 何 执行 的 。 前 面 曾经 举 过 一 个 计算 “1+1? 的 例子 ， 这 
样 的 算术 题目 显然 太 过 简单 了 ， 笔 者 准备 了 四 则 运算 的 例子 ， 请 看 代码 
清单 8-16。 








代码 清单 8-16 ”一 段 简单 的 算术 代码 





public int calc(){ 
int a=100; 

int b=200; 

int c=300; 

return (a+b) *c; 


} 











从 Java 语 言 的 角度 来 看 ， 这 段 代码 没有 任何 解释 的 必要 ， 可 以 直接 
使 用 javap 命 令 看 看 它 的 字 市 码 指令 ， 如 代码 清单 8-17 所 示 。 


代码 清 蛙 8-17 一 段 简单 的 算术 代码 的 字 市 码 表示 





public int calc(); 

Code: 

Stack=2, Locals=4, Args size=1 
0:bipush 100 

2:istore 1 
3:sipush 200 
6 

了 








:i]store 2 
:sipush 300 





FO: LStoOre 3 
11:4 oad 1 





:iload 2 
:iadd 
:iload 3 
:imul 
:ireturn 











3 3 
oy CH es ty My 








javap 提 示 这 上 段 代 码 需 要 深度 为 2 的 操作 数 栈 和 4 个 Slot 的 局 部 变量 空 
间 ， 笔 者 根据 这 些 信 息 夯 了 图 8-5~ 图 8-11 共 7 张 图 ， 用 它们 来 摘 述 代码 
清单 8-17 执 行 过 程 中 的 代码 、 操 作 数 栈 和 局 部 变量 表 的 变化 情况 。 


程序 计数 器 首先 执行 偏 移 地 址 为 0 的 指 

全称 。 助 记 符 令 ，bipush 指 令 的 作用 是 将 单字 

| 0: bipush 100 | 电 要 | 入 的 整 型 常量 值 ( -128~127 ) 
2 数 栈 顶 ， 有 一 








istore_l 跟随 有 一 个 
sipush 200 参数 ， 指 明 推 送 的 常量 值 ， 这 
istore 2 里 是 100， 

sipush 300 


istore 3 


iload 1 
iload 2 
iadd 
iload 3 
im 





图 8-5 执行 偏 移 地 址 为 0 的 指令 的 情况 





助 证 符 程序 计 效 器 执行 偏 移 地 址 为 2 的 指 全 
istore_1 指 令 的 作用 是 将 操作 数 
bipush 100 [2 |] 时 栈 项 的 整 型 值 出 栈 并 存放 到 第 1 


i st ore 1 


个 局 部 变量 Slot 中 。 后 续 4 条 指 
令 ( 直到 偏 移 为 11 的 指令 为 止 ) 
i 对 应 代码 中 把 变量 a、b 、c 赋 值 
h 300 
ei 为 100、200、300。 这 4 条 指令 
的 图 示 赂 过 ， 





istore 3 
iload_1 
iload_2 
12dd 
iload 3 
Im 


、 凡 行 全 移 地 址 为 11 的 指令 ， 
WE Wn ee 指令 的 作 用 是 将 局 部 变 
0: bipush 100 量 表 第 1 个 Slot 中 的 整 型 值 复制 
2 istere -1 到 操作 数 栈 顶 
ch sipush 200 
6 1store 2 
sipush 300 
10: lstore 3 
下 iload 1 
iload 2 
iadd 
1load 3 
imul 





ireturT. 





图 8-7 执行 偏 移 地 址 为 11 的 指令 的 情况 


偏 移 


助 记 符 
bipush 100 
istore_l 
sipush 200 
istore 2 
sipush 300 
istore 3 


iload_ 1 


执行 偏 移 地 址 为 12 的 指令 ， 
iload_2 指 令 的 执行 过 程 与 jload_l 
类 似 ， 把 第 2 个 Slot 的 整 型 值 人 
栈 。 画 出 这 个 指令 的 图 示 主 要 是 
为 了 显示 下 一 条 iadd 指 令 执 行 前 
的 堆栈 状况 ， 





图 8-8 执行 偏 移 地 址 为 12 的 指令 的 情况 


助 记 符 
bipush 100 
istore_l 
sipush 200 
istore 2 
sipush 300 


istore 3 


iload_1 
iload 2 





ja 





iload 3 
Im 二 


ireturr. 


程序 计数 器 


执行 偏 移 地 址 为 13 的 指令 ， 
iadd 指 令 的 作用 是 将 操作 数 栈 中 
头 两 个 栈 顶 元 素 出 栈 ， 做 整 型 加 
法 ,然后 把 结果 重新 人 栈 。 在 
iadd 指 令 执行 完毕 后 ， 栈 中 厚 有 
的 100 和 200 出 栈 ， 它 们 和 300 重 
新 入 栈 





图 8-9 执行 偏 移 地 址 为 13 的 指令 的 情况 


助 记 符 程序 计数 器 
bipush 100 


1store_1 
sipush 200 
istore 2 
sipush 300 
istore 3 
iload 1 
iload 2 
isadd 


助 记 符 
bipush 100 
1store_ 1 
sipush 200 
istore 2 
sipush 300 
istore 3 
iload 1 
iload 2 
isdd 
iload 3 


执行 偏 移 地 址 为 14 的 指 今 ， 
iload_3 指 令 把 存放 在 第 3 个 局 部 
变量 Slot 中 的 300 压 人 操作 数 栈 
中 。 这 时 操作 数 栈 为 两 个 整数 
300。 下 一 条 指令 imul 是 将 操作 
数 栈 中 头 两 个 栈 顶 元 素 出 栈 ， 做 
整 型 乘法 ， 然 后 把 结果 重新 人 
栈 ， 与 iadd 完 全 类 似 ， 所 以 笔者 
省 略图 示 。 


执行 偏 移 地 址 为 16 的 指令 ， 
ireturn 指 令 是 方法 返回 指令 之 
， 它 将 结束 方法 执行 并 将 操作 
数 栈 项 的 整 型 值 返 回 给 此 方法 的 
调用 者 。 到 此 为 止 ， 这 段 方法 执 


行 结束 . 





图 8-11 执行 偏 移 地 址 为 16 的 指令 的 情况 


上 面 的 执行 过 程 仅 仅 是 一 种 概念 模型 ， 虚 拟 机 最 终 会 对 执行 过 程 做 
一 些 优化 来 提高 性 能 ， 实 际 的 运作 过 程 不 一 定 完 全 符合 概念 模型 的 描 
述 .……. 更 准确 地 说 ， 实 际 情况 会 和 上 面 描述 的 概念 模型 差距 非常 大 ， 这 
种 兰 距 产生 的 原因 是 虚拟 机 中 解析 峰 和 即时 编译 圳 都 会 对 输入 的 字 节 人 码 
进行 优化 ， 例 如 ， 在 HotSpot 虚 拟 机 中 ， 有 很 多 以 "fast "开头 的 非 标 准 字 
节 码 指令 用 于 合并 、 符 换 输入 的 字 节 码 以 提升 解释 执行 性 能 ， 而 即时 纺 
译 器 的 优化 手段 更 加 花样 繁多 站 。 


不 过 ， 我 们 从 这 段 程 序 的 执行 中 也 可 以 看 出 栈 结构 指令 集 的 一 般 运 
行 过 程 ， 整 个 运算 过 程 的 中 间 变 量 都 以 操作 数 栈 的 出 栈 、 入 栈 为 信息 交 
换 途 径 ， 符 合 我 们 在 前 面 分 析 的 特点 。 


[1 具体 可 以 参考 第 11 草 中 的 相关 内 容 。 


8.5 ”本 章 小 结 


本 章 中 ， 我 们 分 析 了 虚拟 机 在 执行 代码 时 ， 如 何 找到 正确 的 方法 、 
如 何 执行 方法 内 的 字 节 码 ， 以 及 执行 代码 时 涉及 的 内 存 结构 。 在 第 6、 
7、8 三 章 中 ， 我 们 针对 Java 程 序 是 如 何 存储 的 、 如 何 载 入 《创建 ) 的 ， 
以 及 如 何 执行 的 问题 把 相关 知识 进行 了 讲解 ， 第 9 章 我 们 将 一 起 看 看 这 
些 理论 知识 在 具体 开发 之 中 的 经 典 应 用 。 


第 9 章 ”类 加 载 及 执行 子 系统 的 案例 与 实战 





代码 编译 的 结果 从 本 地 机 器 人 码 转变 为 字 节 人 码 ， 是 存储 格式 发 展 的 一 
小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


9.1 概述 





在 Class 文 件 格式 与 执行 引擎 这 部 分 中 ， 用 户 的 程序 能 直接 影响 的 内 
容 并 不 太 多 ，Class 文 件 以 何 种 格式 存储 ， 类 型 何 时 加 载 、 如 何 连接 ， 以 
及 虚拟 机 如 何 执 行 字 节 人 码 指令 等 都 是 由 虚拟 机 下 接 控 制 的 行为 ， 用 户 程 
序 无 法 对 其 进行 改变 。 能 通过 程序 进行 操作 的 ， 主 要 是 字 节 码 生成 与 类 
加 载 器 这 两 部 分 的 功能 ， 但 仅仅 在 如 何 处 理 这 两 点 上 ， 就 已 经 出 现 了 许 
多 值得 欣赏 和 借鉴 的 思路 ， 这 些 思路 后 来 成 为 了 许多 常用 功能 和 程序 实 
现 的 基础 。 在 本 章 中 ， 我 们 将 看 一 下 前 面 所 学 的 知识 在 实际 开发 之 中 是 
如 何 应 用 的 。 


9.2” 守 例 分 本 


在 案例 分 析 部 分 ， 笔 者 准备 了 4 个 例子 ， 关 于 类 加 载 器 和 字 市 码 的 
案例 各 有 两 个 。 并 且 这 两 个 领域 的 案例 中 各 有 一 个 案例 是 大 多 数 Java 开 
发 人 员 都 使 用 过 的 工具 或 技术 ， 男 外 一 个 案例 虽然 不 一 定 每 个 人 都 使 用 
过 ,但 却 特别 精彩 地 演绎 出 这 个 领域 中 的 技术 特性 。 布 望 这 些 采 例 能 引 
起 读者 的 思考 ， 并 给 读者 的 日 常 工作 带 来 灵感 。 








9.2.1 Tomcat: 正统 的 类 加 载 器 架构 


主流 的 Java Web 服 务 器 ， 如 Tomcat、Jetty、WebLogic、WebSphere 
或 其 他 笔者 没有 列举 的 服务 器 ， 都 实现 了 自己 定义 的 类 加 载 器 (一 般 都 
不 止 一 个 ) 。 因 为 一 个 功能 健全 的 Web 服 务 器 ， 要 解决 如 下 几 个 问题 : 


部 署 在 同一 个 服务 器 上 的 两 个 Web 应 用 程序 所 使 用 的 Java 类 库 可 以 
实现 相互 隔离 。 这 是 最 基本 的 需求 ， 两 个 不 同 的 应 用 程序 可 能 会 依赖 同 
一 个 第 三 方 类 库 的 不 同 版 本 ， 不 能 要 求 一 个 类 库 在 一 个 服务 器 中 只 有 一 
份 ， 服 务 器 应 当 保 证 两 个 应 用 程序 的 类 库 可 以 互相 独立 使 用 。 


部 署 在 同一 个 服务 器 上 的 两 个 web 应 用 程序 所 使 用 的 Java 类 库 可 以 
互相 共享 。 这 个 需求 也 很 常见 ， 例 如 ， 用 户 可 能 有 10 个 使 用 Spring 组 织 
的 应 用 程序 部 晋 在 同一 人 台 服 务 堪 上 ， 如 果 把 10 份 Spring 分 别 存放 在 各 个 








应 用 程序 的 阳 离 目 录 中 ， 将 会 是 很 大 的 资源 浪费 一 一 这 主要 倒 不 是 浪费 
磁盘 空间 的 问题 ， 而 是 指 类 库 在 使 用 时 都 要 被 加 载 到 服务 器 内 存 ， 如 宁 
类 库 不 能 共 孚 ， 虚 拟 机 的 方法 区 就 会 很 容易 出 现 过 度 膨 胀 的 风险 。 


服务 器 需要 尽 可 能 地 保证 目 身 的 安全 不 受 部 普 的 Web 应 用 程序 影 
啊 。 目 前 ， 有 许多 主流 的 Java Web 服 务 露 目 身 也 是 使 用 Java 语 言 来 实现 
的 。 因 此 ， 服 务 器 本 映 也 有 类 库 依 赖 的 问题 ， 一 般 来 说 ， 基 于 安全 考 
虑 ， 服 务 嚣 所 使 用 的 类 库 应 该 与 应 用 程序 的 类 库 互 相 独 立 。 





支持 JSP 应 用 的 Web 服 务 嚣 ， 大 多 数 都 需要 支持 HotSwap 功 能 。 我 们 
知道 ，JSP 文 件 最 终 要 编译 成 Java Class 才 能 由 虚拟 机 执行 ， 但 JSP 文 件 由 
于 其 纯 文本 存储 的 特性 ， 运 行 时 修改 的 概率 远 远 大 于 第 三 方 类 库 或 程序 
自身 的 Class 文 件 。 而 且 ASP、PHP 和 JSP 这 些 网 页 应 用 也 把 修改 后 无 须 
重启 作为 一 个 很 大 的 “优势 ”来 看 待 ， 因 此 “主流 ”的 Web 服 务 器 都 会 支持 

JSP 生 成 类 的 热 奉 换 ， 当 然 也 有 “ 非 主 流 ” 的 ， 如 运行 在 生产 模式 
(Production Mode) 下 的 WebLogic 服 务 器 默认 就 不 会 处 理 JSP 文 件 的 变 
化 。 





由 于 存在 上 述 问 题 ， 在 部 署 Web 应 用 时 ， 单 独 的 一 个 ClassPath 就 无 
法 满足 需求 了 ， 所 以 各 种 Web 服 务 器 都 “不 约 而 同 ” 地 提供 了 好 几 个 
ClassPath 路 径 供用 户 存放 第 三 方 类 库 ， 这 些 路 径 一 般 都 
以 "lib" 或 "classes" 命 名 。 被 放置 到 不 同 路 径 中 的 类 库 ， 具 备 不 同 的 访问 
范围 和 服务 对 象 ， 通 常 ， 每 一 个 目录 都 会 有 一 个 相应 的 自 定义 类 加 载 器 





去 加 载 放置 在 里 面 的 Java 类 库 。 现 在 ， 笔 者 就 以 Tomcat 服 务 器 由 为 例 ， 
看 一 看 Tomcat 有 具体 是 如 何 规划 用 户 类 库 结 构 和 类 加 载 器 的 。 








在 Tomcat 目 录 结 构 中 ， 有 3 组 目录 
("common/*"、"/server/*" 和 "/shared/*") 可 以 存放 Java 类 库 ， 另 外 还 可 
以 加 上 Web 应 用 程序 自身 的 目录 "WEB-INF/*"， 一 共 4 组 ， 把 Java 类 库 放 

置 在 这 些 目 录 中 的 含义 分 别 如 下 。 





放置 在 /common 目 录 中 : 类 库 可 被 Tomcat 和 所 有 的 Web 应 用 程序 共 
同 使 用 。 


放置 在 /server 目 录 中 : 类 库 可 被 Tomcat 使 用 ， 对 所 有 的 Web 应 用 程 
序 都 不 可 见 。 


放置 在 /shared 目 录 中 : 类 库 可 被 所 有 的 Web 应 用 程序 共同 使 用 ， 但 
对 Tomcat 自 己 不 可 见 。 


放置 在 /WebApp/WEB-INF 目 录 中 : 类 库 仅 仅 可 以 被 此 Web 应 用 程 
序 使 用 ， 对 Tomcat 和 其 他 Web 应 用 程序 都 不 可 见 。 








为 了 支持 这 套 目 录 结 构 ， 并 对 目录 里 面 的 类 库 进 行 加 载 和 隔离 ， 
Tomcat 自 定义 了 多 个 类 加 载 器 ， 这 些 类 加 载 器 按照 经 典 的 双亲 委派 模型 
来 实现 ， 其 关系 如 图 9-1 所 示 。 





Common 类 加载 器 
CommonClassLoader 


A AS 


Catalina 类 加 | 载 器 Shared 类 加 载 器 
CatalinaClassLoader SharedClassLoader 


图 9-1 Tomcat 服 务 器 的 类 加 载 架构 


灰色 背景 的 3 个 类 加 载 器 是 JDK 默 认 提 供 的 类 加 载 器 ， 这 3 个 加 载 器 





的 作用 在 第 7 音 中 已 经 介绍 过 了 。 而 CommonClassLoader、 
CatalinaClassLoader、SharedClassLoader 和 WebappClassLoader 则 是 
Tomcat 上 自己 定义 的 类 加 载 器 ， 它 们 分 别 加 

载 /common/*、/server/*、/shared/* 和 /WebApp/WEB-INF/* 中 的 Java 类 
库 。 其 中 WebApp 类 加 载 强 和 Jsp 类 加 载 莫 通常 会 存在 多 个 实例 ， 每 一 个 
Web 应 用 程序 对 应 一 个 WebApp 类 加 载 器 ， 每 一 个 JSP 文 件 对 应 一 个 Jsp 
类 加 载 硕 。 





从 图 9-1 的 委派 关系 中 可 以 看 出 ，CommonClassLoader 能 加 载 的 类 都 
可 以 被 Catalina ClassLoader 和 SharedClassLoader 使 用 ， 而 
CatalinaClassLoader 和 SharedClassLoader 自 己 能 加 载 的 类 则 与 对 方 相互 隔 
离 。WebAppClassLoader 可 以 使 用 SharedClassLoader 加 载 到 的 类 ， 但 各 





个 WebAppClassLoader 实 例 之 间 相 互 隔 离 。 而 JasperLoader 的 加 载 范 围 仅 
仅 是 这 个 JSP 文 件 所 编译 出 来 的 那 一 个 Class， 它 出 现 的 目的 就 是 为 了 被 
丢弃 : 当 服 务 器 检测 到 JSP 文 件 被 修改 时 ， 会 替换 掉 目 前 的 JasperLoader 
的 实例 ， 并 通过 再 建立 一 个 新 的 Jsp 类 加 载 器 来 实现 JSP 文 件 的 HotSwap 


对 于 Tomcat 的 6.x 版 本 ， 只 有 指定 了 tomcat/conf/catalina.properties 配 
置 文件 的 server.loader 和 share.loader 项 后 才 会 真正 建立 
CatalinaClassLoader 和 SharedClassLoader 的 实例 ， 否 则 会 用 到 这 两 个 类 加 
载 器 的 地 方 都 会 用 CommonClassLoader 的 实例 代替 ， 而 默认 的 配置 文件 


中 没有 设置 这 两 个 loader 项 ， 所 以 Tomcat 6.x 顺 理 成 章 地 

把 /common、/server 和 /shared 三 个 目录 默认 合并 到 一 起 变 成 一 个 /lib 目 
录 ， 这 个 目录 里 的 类 库 相 当 于 以 前 /common 目 录 中 类 库 的 作用 。 这 是 
Tomcat 设 计 团队 为 了 简化 大 多 数 的 部 署 场景 所 做 的 一 项 改进 ， 如 果 默 认 
设置 不 能 满足 需要 ， 用 户 可 以 通过 修改 配置 文件 指定 server.loader 和 
share.loader 的 方式 重新 启用 Tomcat 5.x 的 加 载 器 架构 。 





Tomcat 加 载 器 的 实现 清晰 易 懂 ， 并 且 采 用 了 官方 推荐 的 “正统 ”的 使 
用 类 加 载 器 的 方式 。 如 果 读 者 阅读 完 上 面 的 案例 后 ， 能 完全 理解 Tomcat 
设计 团队 这 样 布置 加 载 器 架构 的 用 意 ， 那 说 明 已 经 大 致 掌握 了 类 加 载 
器 “主流 ”的 使 用 方式 ， 那 么 笔者 不 妨 再 提 一 个 问题 让 读者 思考 一 下 : 前 
面 曾 经 提 到 过 一 个 场景 ， 如 果 有 10 个 Web 应 用 程序 都 是 用 Spring 来 进行 
组 织 和 管理 的 话 ， 可 以 把 Spring 放 到 Common 或 Shared 目 录 下 让 这 些 程序 
共享 。Spring 要 对 用 户 程序 的 类 进行 管理 ， 自 然 要 能 访问 到 用 户 程序 的 
类 ， 而 用 户 的 程序 显然 是 放 在 /WebApp/WEB-INF 目 录 中 的 ， 那 么 被 
CommonClassLoader 或 SharedClassLoader 加 载 的 Spring 如 何 访问 并 不 在 其 
加 载 范 围 内 的 用 户 程序 呢 ? 如 果 读 过 本 书 第 7 章 的 相关 内 容 ， 相 信 读 者 


可 以 很 容易 地 回答 这 个 问题 。 








[Tomcat 是 Apache 基 金 会 中 的 一 款 开 源 的 Java Web 服 务 器 ， 主 页 地 址 
为 : http://tomcat.apache.org。 本 案例 中 选用 的 是 Tomcat 5.x 服 务 器 的 目 
录 和 类 加 载 器 结构 ， 在 Tomcat 6.x 的 默认 配置 下 ,，/common、 /server 


和 /shared 三 个 目录 已 经 合并 到 一 起 了 。 


9.2.2 0OSGi: 灵活 的 类 加 载 器 架构 


Java 程 序 社区 中 流传 着 这 么 一 个 观点 : “学 习 JEE 规 范 ， 去 看 JBoss 源 
码 ; 学 习 类 加 载 器 ， 就 去 看 OSGi 源 码 ”。 尽 管 JJEE 规 范 >? 和 “类 加 载 器 的 
知识 ”并 不 是 一 个 对 等 的 概念 ， 不 过 ， 既 然 这 个 观点 能 在 程序 员 中 流传 
开 来 ， 也 从 侧面 说 明了 OSGi 对 类 加 载 器 的 运用 确实 有 其 独到 之 处 。 


OSGil1] (Open Service Gateway Initiative〉 是 OSGi 联 盟 (OSGi 
Alliance) 制定 的 一 个 基于 Java 语 言 的 动态 模块 化 规范 ， 这 个 规范 最 初 由 
Sun、IBM、 爱 立信 等 公司 联合 发 起 ， 目 的 是 使 服务 提供 商 通过 住宅 网 
关 为 各 种 家 用 智能 设备 提供 各 种 服务 ， 后 来 这 个 规范 在 Java 的 其 他 技术 
领域 也 有 相当 不 错 的 发 展 ， 现 在 已 经 成 为 Java 世 界 中 “事实 上 ”的 模块 化 
标准 ， 并 且 已 经 有 了 Equinox、Felix 等 成 熟 的 实现 。OSGi 在 Java 程 序 员 
中 最 著名 的 应 用 案例 就 是 Eclipse IDE， 另 外 还 有 许多 大 型 的 软件 平台 和 
中 间 件 服务 器 都 基于 或 声明 将 会 基于 OSGi 规 范 来 实现 ， 如 IBM Jazz 平 
人 台 、GlassFish 服 务 器 、jBoss OSGi 等 。 











OSGi 中 的 每 个 模块 〈 称 为 Bundle) 与 普通 的 Java 类 库 区 别 并 不 太 
大 ， 两 者 一 般 都 以 JAR 格 式 进 行 封 装 ， 并 且 内 部 存储 的 都 是 Java Package 
和 Class。 但 是 一 个 Bundle 可 以 声明 它 所 依赖 的 Java Package〈 通 过 
Import-Package 描 述 ) ， 也 可 以 声明 它 允 许 导 出 发 布 的 Java Package ( 通 


过 Export-Package 描 述 ) 。 在 OSGi 里 面 ，Bundle 之 间 的 依赖 关系 从 传统 
的 上 层 模 块 依赖 底层 模块 转变 为 平 级 模块 之 间 的 依赖 (至 少 外 观 上 如 
此 ) ， 而 且 类 库 的 可 见 性 能 得 到 非常 精确 的 控制 ， 一 个 模块 里 只 有 被 
Export 过 的 Package 才 可 能 由 外 界 访问 ， 其 他 的 Package 和 Class 将 会 隐藏 
起 来 。 除 了 更 精确 的 模块 划分 和 可 见 性 控制 外 ， 引 入 OSGi 的 另外 一 个 
重要 理由 是 ， 基 于 OSGi 的 程序 很 可 能 (只 是 很 可 能 ， 并 不 是 一 定 会 ) 
可 以 实现 模块 级 的 热 播 拔 功能 ， 当 程序 升级 更 新 或 调试 除 错时 ， 可 以 只 
停 用 、 重 新 安装 然后 启用 程序 的 其 中 一 部 分 ， 这 对 企业 级 程序 开发 来 说 


征 一 个 非常 有 诱惑 力 的 特性 。 








0OSGi 之 所 以 能 有 上 述 * 诱 人 ”的 特点 ， 要 归功 于 它 灵 活 的 类 加 载 器 架 
构 。OSGi 的 Bundle 类 加 载 器 之 间 只 有 规则 ， 没 有 固定 的 委派 关系 。 例 
如 ， 某 个 Bundle 声 明了 一 个 它 依赖 的 Package， 如 果 有 其 他 Bundle 声 明 发 
布 了 这 个 Package， 那 么 所 有 对 这 个 Package 的 类 加 载 动作 都 会 委派 给 发 
布 它 的 Bundle 类 加 载 器 去 完成 。 不 涉及 某 个 具体 的 Package 时 ， 各 个 
Bundle 加 载 器 都 是 平 级 关系 ， 只 有 具体 使 用 某 个 Package 和 Class 的 时 
候 ， 才 会 根据 Package 导 入 导出 定义 来 构造 Bundle 间 的 委派 和 依赖 。 








另外 ， 一 个 Bundle 类 加 载 器 为 其 他 Bundle 提 供 服 务 时 ， 会 根据 
Export-Package 列 表 严 格 控制 访问 范围 。 如 果 一 个 类 存在 于 Bundle 的 类 
库 中 但 是 没有 被 Export， 那 么 这 个 Bundle 的 类 加 载 器 能 找到 这 个 类 ， 但 
不 会 提供 给 其 他 Bundle 使 用 ， 而 且 OSGi 平 台 也 不 会 把 其 他 Bundle 的 类 加 


载 请 求 分 配给 这 个 Bundle 来 处 理 。 


我 们 可 以 举 一 个 更 具体 一 些 的 简单 例子 ， 假 设 存在 Bundle A、 
Bundle B、Bundle C 三 个 模块 ， 并 且 这 三 个 Bundle 定 义 的 依赖 关系 如 
下 


Bundle A: 声明 发 布 了 packageA， 依 赖 了 java.* 的 包 。 


Bundle B: 声明 依赖 了 packageA 和 packageC， 同 时 也 依赖 了 java.* 的 


Bundle C: 声明 发 布 了 packageC， 依 赖 了 packageA。 


那么 ， 这 三 个 Bundle 之 间 的 类 加 载 器 及 父 类 加 载 器 之 间 的 关系 如 图 


9-2 所 示 O 〇 





图 9-2 OSGi 的 类 加 载 器 架 构 


由 于 没有 窑 扯 到 具体 的 OSGi 实 现 ， 所 以 图 9-2 中 的 类 加 载 器 部 没有 
指明 具体 的 加 载 嚣 实现， 只 是 一 个 体现 了 加 载 促 之 间 关 系 的 概念 模型 ， 
并 且 只 是 体现 了 OSGi 中 最 简单 的 加 载 器 委派 关系。 一 般 来 说 ， 在 OSGi 
中 ， 加 载 一 个 类 可 能 发 生 的 查找 行为 和 委派 关系 会 比 图 9-2 中 骂 示 的 复 
杂 得 多 ， 类 加 载 时 可 能 进行 的 查找 规则 如 下 : 








以 java.* 开 头 的 类 ， 委 浜 给 父 类 加 载 吉 加 载 。 





含 则 ， 委 派 列 表 名 单 内 的 类 ， 委 派 给 父 类 加 载 右 加 载 。 





否则 ，Import 列 表 中 的 类 ， 委 派 给 Export 这 个 类 的 Bundle 的 类 加 载 
器 加 载 。 


否则 ， 查 找 当 前 Bundle 的 Classpath， 使 用 自己 的 类 加 载 器 加 载 。 





人 硅 则 ， 查 找 是 否 在 上 自己 的 Fragment Bundle 中 ， 如 果 是 ， 则 委派 给 
Fragment Bundle 的 类 加 载 器 加 载 。 


否则， 得 找 Dynamic Import 列 表 的 Bundle， 委 派 给 对 应 Bundle 的 类 
加 载 器 加 载 。 


否则 ， 关 得 找 失败 。 


从 图 9-2 中 还 可 以 看 出 ， 在 OSGi 里 面 ， 加 载 器 之 间 的 关系 不 再 是 双 


亲 委 派 模型 的 树 形 结构 ， 而 是 已 经 进一步 发 展 成 了 一 种 更 为 复杂 的 、 运 
行 时 才能 确定 的 网 状 结构 。 这 种 网 状 的 类 加 载 器 架构 在 带 来 更 好 的 灵活 
性 的 同时 ， 也 可 能 会 产生 许多 新 的 隐患 。 笔 者 曾经 参与 过 将 一 个 非 
OSGi 的 大 型 系统 向 Equinox OSGi 平 台 迁 移 的 项 目 ， 由 于 历史 原因 ， 代 码 
模块 之 间 的 依赖 关系 错综复杂 ， 勉 强 分 离 出 各 个 模块 的 Bundle 后 ， 发 现 
在 高 并 发 环境 下 经 常 出 现 死 锁 。 我 们 很 容易 就 找到 了 死 锁 的 原因 : 如 果 
出 现 了 Bundle A 依赖 Bundle B 的 PackageB， 而 Bundle B 又 依赖 了 Bundle 
A 的 Package A， 这 两 个 Bundle 进 行 类 加 载 时 就 很 容易 发 生死 锁 。 有 具体 情 
况 是 当 Bundle A 加 载 Package B 的 类 时 ， 首 先 需 要 锁定 当前 类 加 载 器 的 实 
例 对 象 (java.lang.ClassLoader.loadClass() 是 一 个 synchronized 方 法 ) ， 然 
后 把 请 求 委 派 给 Bundle B 的 加 载 器 处 理 ， 但 如 果 这 时 候 Bundle B 也 正好 
想 加 载 Package A 的 类 ， 它 也 先 锁 定 上 自己 的 加 载 右 再 去 请 求 Bundle A 的 加 
载 嚣 处理， 这 样 ， 两 个 加 载 器 都 在 等 竺 对方 处 理 自己 的 请 求 ， 而 对 方 处 
理 完 之 前 自己 又 一 直 处 于 同步 锁定 的 状态 ， 因 此 它们 就 互相 死 锁 ， 永 远 
无 法 完成 加 载 请 求 了 。Equinox 的 Bug List 中 有 关于 这 类 问题 的 Bugl”， 

也 提供 了 一 个 以 牺牲 性 能 为 代价 的 解决 方案 一 一 用 户 可 以 启用 
osgi.classloader.singleThreadLoads 参 数 来 按 单线 程 串 行 化 的 方式 强制 进 
行 类 加 载 动 作 。 在 JDK 1.7 中 ， 为 非 树 状 继承 关系 下 的 类 加 载 器 架构 进 
行 了 一 次 专门 的 升级 趾 ， 目 的 是 从 底层 避免 这 类 死 锁 出 现 的 可 能 。 




















忆 体 来 说 ，OSGi 摘 绘 了 一 个 很 美好 的 模块 化 开发 的 目标 ， 而 且 定 
义 了 实现 这 个 目标 所 需要 的 各 种 服务 ， 同 时 也 有 成 熟 框架 对 其 提供 实现 


文 持 。 对 于 单个 虚拟 机 下 的 应 用 ， 从 开发 初期 就 建立 在 0OSGi 上 是 一 个 
很 不 错 的 选择 ， 这 样 便于 约束 依赖 。 但 并 非 所 有 的 应 用 都 适合 采用 
OSGi 作 为 基础 架构 ，OSGi 在 提供 强大 功能 的 同时 ， 也 引入 了 额外 的 复 
杂 度 ， 带 来 了 线程 死 锁 和 内 存 泄 漏 的 风险 。 


[1]OSGi 官 方 站 点 : http://www.osgi.otg/ Main/HomePage。 
[2]Bug-121737: https://bugs.eclipse.org/bugs/show_bug.cgi?id=121737。 
B31JDK 1.7-Upgrade class-loader atchitectute : 


http:/ /openjdk.java.net/pPtojects/jdk7/featutes/ 并 f352。 


9.2.3” 字 节 码 生成 技术 与 动态 代理 的 实现 





“ 字 节 码 生 成 并 不 是 什么 高 深 的 技术 ， 读 者 在 看 到 “ 字 节 码 生 成 ”这 
个 标题 时 也 先 不 必 去 想 诸 如 Javassist、CGLib、ASM 之 类 的 字 节 码 类 
库 ， 因 为 JDK 里 面 的 javac 命 令 就 是 字 节 码 生成 技术 的 “ 老 祖 宗 "， 并 且 
javac 也 是 一 个 由 Java 语 言 写成 的 程序 ， 它 的 代码 存放 在 OpenJDK 的 
langtools/src/share/classes/com/sun/tools/javac 目 录 中 中 。 要 深入 了 解 字 节 
码 生 成 ， 阅 读 javac 的 源码 是 个 很 好 的 途径 ， 不 过 javac 对 于 我 们 这 个 例 
子 来 说 太 过 庞大 了 。 在 Java 里 面 除 了 javac 和 字 节 码 类 库 外 ， 使 用 字 节 码 
生成 的 例子 还 有 很 多 ， 如 Web 服 务 器 中 的 JSP 编 译 器 ， 编 译 时 植 入 的 
AOP 框 架 ， 还 有 很 常用 的 动态 代理 技术 ， 甚 至 在 使 用 反射 的 时 候 虚 拟 机 
都 有 可 能 会 在 运行 时 生成 字 节 码 来 提高 执行 速度 。 我 们 选择 其 中 相对 简 
单 的 动态 代理 来 看 看 字 节 码 生成 技术 是 如 何 影响 程序 运作 的 。 














相信 许多 Java 开 发 人 员 都 使 用 过 动态 代理 ， 即 使 没有 直接 使 用 过 
java.lang.reflect.Proxy 或 实现 过 java.lang.reflect.InvocationHandler 接 口 ， 
应 该 也 用 过 Spring 来 做 过 Bean 的 组 织 管理 。 如 果 使 用 过 Spring， 那 大 多 
数 情况 都 会 用 过 动态 代理 ， 因 为 如 果 Bean 是 面向 接口 编程 ， 那 么 在 
Spring 内 部 都 是 通过 动态 代理 的 方式 来 对 Bean 进 行 增强 的 。 动 态 代 理 中 
所 谓 的 “动态 ”， 是 针对 使 用 Java 代 码 实际 编写 了 代理 类 的 “静态 ”代理 而 
言 的 ， 它 的 优势 不 在 于 省 去 了 编写 代理 类 那 一 点 工作 量 ， 而 是 实现 了 可 

















以 在 原始 类 和 接口 还 未 知 的 时 候 ， 就 确定 代理 类 的 代理 行为 ， 当 代理 类 
与 原始 类 脱离 直接 联系 后 ， 就 可 以 很 灵活 地 重用 于 不 同 的 应 用 场景 之 
中 。 


代码 清单 9-1 演 示 了 一 个 最 简单 的 动态 代理 的 用 法 ， 原 始 的 逻辑 是 
打印 一 名 "hello world"， 代 理 类 的 逻辑 是 在 原始 类 方法 执行 前 打印 一 
名 "welcome"。 我 们 先 看 一 下 代码 ， 然 后 再 分 析 JDK 是 如 何 做 到 的 。 





代码 清单 9-1 动态 代理 的 简单 示例 





public class DynamicProxyTest{ 

interface IHello{ 

void sayHello (); 

} 

static class Hello implements IHellof 

QOverride 

public void sayHello(){ 

System.out .println ("hello wor1ldq") ; 

} 

} 

static class DynamicProxy implements JInvocationHandlert 

Object originalObj:; 

Object bind (Object originalObj) { 

this.originalObj=originalObj; 

return 

Proxy.newProxyInstance (originalObj.getClass() .getClassLoader ()， 
originalObj.getClass() .getIinterfaces(), this),; 

} 

QOverride 

public Object invoke (Object proxy,Method method,Object[]args) 
throws Throwablel{ 

System.out .println ("welcome").; 

return method.invoke (originalObj,args); 

} 

} 

public static void main (String[]args) 1 
IHello hello= (IHello) new DynamicProxy() .bind (new Hello()) ; 
hello.sayHello(); 



























































运行 结果 如 下 : 





welcome 
hello world 








上 述 代 码 里 ， 唯 一 的 “黑匣子 ”就 是 Proxy.newProxyInstance() 方 法 ， 
除 此 之 外 再 没有 任何 特殊 之 处 。 这 个 方法 返回 一 个 实现 了 IHello 的 接 
口 ， 并 且 代 理 了 new Hello0) 实 例 行 为 的 对 象 。 跟 踊 这 个 方法 的 源码 ， 可 
以 看 到 程序 进行 了 验证 、 优 化 、 缓 存 、 同 步 、 生 成 字 节 码 、 显 式 类 加 载 
等 操作 ， 前 面 的 步骤 并 不 是 我 们 关注 的 重点 ， 而 最 后 它 调 用 了 
sun.misc.ProxyGenerator.generateProxyClass() 方 法 来 完成 生成 字 节 码 的 动 
作 ， 这 个 方法 可 以 在 运行 时 产生 一 个 描述 代理 类 的 字 节 码 byte[] 数 组 。 
如 果 想 看 一 看 这 个 在 运行 时 产生 的 代理 类 中 写 了 些 什么 ， 可 以 在 main() 
方法 中 加 入 下 面 这 人 句 : 








System.getProperties() .put ("sun.misc.ProxyGenerator.saveGeneratedI 








加 入 这 句 代 码 后 再 次 运行 程序 ， 人 磁盘 中 将 会 产生 一 个 名 
为 "$Proxy0.class" 的 代理 类 Class 文 件 ， 反 编译 后 可 以 看 见 如 代码 清单 9-2 
所 示 的 内 容 。 


代码 清单 9-2” 反 编译 的 动态 代理 类 的 代码 








package org.fenixsoft.bytecode:; 

import java.lang.reflect.InvocationHandler:; 

Import java.lang.reflect.Method; 

import java.lang.reflect.Proxy; 

import java.lang.reflect.UndeclaredThrowableException; 
public final class S$Proxy0 extends Proxy 

Implements DynamicProxyTest.IHello 

{ 

private static 
private static M 
private static Method mo; 

private static Method m2; 

public S$Proxy0 (InvocationHandler paramInvocationHandler) 
throws 

{ 

super (paramInvocationHandler).; 

} 

public final void sayHello() 

throws 

{ 
NE 
{ 
this.h.invoke (this,m3, null); 
return; 
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thod m3; 
thod mil; 
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catch (RuntimeException localRuntimeException) 








throw localRuntimeException; 


} 


catch (Throwable localThrowable) 


{ 


throw new UndeclaredThrowableException (LocalThrowable) ; 


} 

















} 

// 此 处 由 于 版 面 原因 ， 省 略 equals ()、hashCode ()、toString () 三 个 方法 的 代码 
// 这 3 个 方法 的 内 容 与 sayHel1lo () 非常 相似 。 

static 


{ 
ty 

















m3=Class.forName ("org.fenixsoft.bytecode.DynamicProxyTest 








IHello") .getMethod ("sayHello", new Class[0]) ; 





ml=Class.forName ("java.lang.Object") .getMethod ("equals", new 














lass[] {Class.forName ("java.lang.Object") }) ; 
m0=Class.forName ("java.lang.Object") .getMethod ("hashCode", new 
lass[0]); 
































m2=Class.forName ("java.lang.Object") .getMethod ("toString", new 





Class[0]) ; 
return; 
} 
catch (NoSuchMethodException localNoSuchMethodException) 
{ 
throw new 

NoSuchMethodError (localNoSuchMethodException.getMessage ()); 
} 
catch (ClassNotFoundException localClassNotFoundException) 
{ 
throw new 

NoClassDefFoundError (localClassNotFoundException.getMessage()); 
) 
} 
} 












































这 个 代理 类 的 实现 代码 也 很 简单 ， 它 为 传 入 接口 中 的 每 一 个 方法 ， 
以 及 从 java.lang.Object 中 继承 来 的 equals()、hashCode()、toString() 方 法 
都 生成 了 对 应 的 实现 ， 并 且 统 一 调用 了 InvocationHandler 对 象 的 invoke() 
方法 (代码 中 的 "this.h" 就 是 父 类 Proxy 中 保存 的 InvocationHandler 实 例 变 
量 ) 来 实现 这 些 方法 的 内 容 ， 各 个 方法 的 区 别 不 过 是 传 入 的 参数 和 
Method 对 象 有 所 不 同 而 已 ， 所 以 无 论调 用 动态 代理 的 哪 一 个 方法 ， 实 际 
上 都 是 在 执行 mnvocationHandler.invoke0O 中 的 代理 逻辑 。 





这 个 例子 中 并 没有 讲 到 generateProxyClass0) 方 法 具体 是 如 何 产生 代 
理 类 "$Proxy0.class" 的 字 节 码 的 ， 大 致 的 生成 过 程 其 实 就 是 根据 Class 文 
件 的 格式 规范 去 拼装 字 节 码 ， 但 在 实际 开发 中 ， 以 byte 为 单位 直接 拼装 
出 字 节 码 的 应 用 场合 很 少见 ， 这 种 生成 方式 也 只 能 产生 一 些 高 度 模 板 化 
的 代码 。 对 于 用 户 的 程序 代码 来 说 ， 如 果 有 要 大 量 操作 字 节 码 的 需求 ， 
还 是 使 用 封装 好 的 字 市 码 类 库 比较 合适 。 如 果 读 者 对 动态 代理 的 字 市 码 








拼装 过 程 很 感 兴趣 ， 可 以 在 OpenJDK 的 jdkysrc/share/classes/sun/misc 目 录 
下 找到 sun.misc.ProxyGenerator 的 源码 。 


四 如 何 获取 OpenJDK 源 码 ， 请 参见 本 书 第 1 章 的 相关 内 容 。 


9.2.4 ”Retrotranslator: 跨越 JDK 版 本 


一 般 来 说 ， 以 “做 项 目 ” 为 主 的 软件 公司 比较 容易 更 新 技术 ， 在 下 一 
个 项 目 中 换 一 个 技术 框架 、 升 级 到 最 新 的 JDK 版 本 ， 甚 至 把 Java 换 成 
C#、C++ 来 开发 程序 都 是 有 可 能 的 。 但 当 公司 发 展 壮大 ， 技 术 有 上 所 积 
累 ， 逐 潮 成 为 以 “做 产品 ?为 主 的 软件 公司 后 ， 目 主 选择 技术 的 权利 惑 会 
并 失掉 ， 因 为 之 前 所 积累 的 代码 和 技术 都 是 用 真 金 白银 换 来 的 ， 一 个 稳 
健 的 团队 也 不 会 随意 地 改变 的 层 的 技术。 然而 在 飞速 发 展 的 程序 设 计 领 
域 ， 新 拉 术 总 是 日 新 月 异 、 层 出 不 穷 ， 偏 偏 这 些 新 技术 又 如 鲜花 之 于 密 
蜂 一 样 ， 对 程序 员 散 发 者 天 然 的 吸引 力 。 




















在 Java 世 界 里 ， 每 一 次 JDK 大 版 本 的 发 布 ， 都 伴随 着 一 场 大 规模 的 
技术 革新 ， 而 对 Java 程 序 编写 习惯 改变 最 大 的 ， 无 疑 是 JDK 1.5 的 发 布 。 
自动 装 箱 、 泛 型 、 动 态 注解 、 枚 举 、 变 长 参数 、 人 遍历 循环 (foreach 循 
环 站 ws 事实 上 ， 在 没有 这 些 语 法 特性 的 年 代 ，Java 程 序 也 照样 能 写 ， 
但 是 现在 看 来 ， 上 述 每 一 种 语法 的 改进 几乎 都 是 “ 必 不 可 少 ” 的 。 就 如 同 
习惯 了 24 寸 液晶 显示 器 的 程序 员 ， 很 难 习 惯 在 15 寸 纯 平 显示 器 上 编写 代 
码 。 但 假如 “不 六 ”因为 要 保护 现 有 投资 、 维 持 程 序 结构 稳定 等 ， 必 须 使 
用 1.5 以 前 版 本 的 JDK 呢 ?我 们 没有 办 法 把 15 寸 显示 器 变 成 24 寸 的 ， 但 却 
可 以 跨越 JDK 版 本 之 间 的 沟 蜜 ， 把 JDK 1.5 中 编写 的 代码 放 到 JDK 1.4 或 
1.3 的 环境 中 去 部 署 使 用 。 为 了 解决 这 个 问题 ， 一 种 名 为 “Java 北 同 移 




















植 > 的 工具 〈Java Backporting Tools) 应 运 而 生 ，Retrotranslatorl1 是 这 类 
工具 中 较 出 色 的 一 个 。 


Retrotranslator 的 作用 是 将 JDK 1.5 编 译 出 来 的 Class 文 件 转变 为 可 以 
在 JDK 1.4 或 1.3 上 部 署 的 版 本 ， 它 可 以 很 好 地 支持 自动 装 箱 、 泛 型 、 动 
态 注 解 、 枚 举 、 变 长 参数 、 遍 历 循环 、 静 态 导入 这 些 语 法 特性 ， 甚 至 还 
可 以 支持 JDK 1.5 中 新 增 的 集合 改进 、 并 发 包 以 及 对 泛 型 、 注 解 等 的 反 
射 操作 。 了 解 了 Retrotranslator 这 种 逆向 移植 工具 可 以 做 什么 以 后 ， 现 在 
关心 的 是 它 是 怎样 做 到 的 ? 





想 知道 Retrotranslator 如 何在 旧版 本 JDK 中 模拟 新 版 本 JDK 的 功 
能 ， 首 先 要 和 弄 清楚 JDK 升 级 中 会 提供 哪些 新 的 功能 。JDK 每 次 升级 新 增 
的 功能 大 致 可 以 分 为 以 下 4 类 : 


在 编译 器 层面 做 的 改进 。 如 自动 装 箱 拆 箱 ， 实 际 上 就 是 编译 器 在 程 
序 中 使 用 到 包 闭 对 象 的 地 方 上 自动 插入 了 很 多 Integer.valueOfO、 
Float.valueOf0) 之 类 的 代码 ;， 变 长 参数 在 编译 之 后 就 自动 转化 成 了 一 个 数 
组 来 完成 参数 传递 ， 泛 型 的 信息 则 在 编译 阶段 就 已 经 擦 除 掉 了 【但 是 在 
元 数据 中 还 保留 着 ) ， 相 应 的 地 方 被 编译 器 自动 插入 了 类 型 转换 代 
但 网。 





对 Java API 的 代码 增强 。 壁 如 JDK 1.2 时 代 引 入 的 java.util.Collections 
等 一 系列 集合 类 ， 在 JDK 1.5 时 代 引 入 的 java.util.concurrent 并 发 包 等 。 


需要 在 字 节 码 中 进行 文 持 的 改动 。 如 JDK 1.7 里 面 新 加 入 的 语法 特 
性 : 动态 语言 支持 ， 就 需要 在 虚拟 机 中 新 增 一 条 invokedynamic 字 节 码 指 
令 来 实现 相关 的 调用 功能 。 不 过 字 节 码 指令 集 一 直 处 于 相对 比较 稳定 的 
状态 ， 这 种 需要 在 字 节 码 层面 直接 进行 的 改动 是 比较 少见 的 。 

















虚拟 机 内 部 的 改进 。 如 JDK 1.5 中 实现 的 JSR-133 中 规范 重新 定义 的 
Java 内 存 模 型 (Java Memory Model,JMM) 、CMS 收 集 器 之 类 的 改动 ， 
这 类 改动 对 于 程序 员 编 写 代 人 码 基 本 是 透明 的 ， 但 会 对 程序 运行 时 产生 影 
啊 。 




















上 述 4 类 新 功能 中 ，Retrotranslator 只 能 模拟 前 两 类 ， 对 于 后 面 两 类 
直接 在 虚拟 机 内 部 实现 的 改进 ， 一 般 所 有 的 逆向 移植 工具 都 是 无 能 为 力 
的 ， 至 少 不 能 完整 地 或 者 在 可 接受 的 效率 上 完成 全 部 模拟 ， 否 则 虚拟 机 
设计 团队 也 没有 必要 舍 近 求 远 地 改 动 处 于 JDK 底 层 的 虚拟 机 。 在 可 以 模 
拟 的 两 类 功能 中 ， 第 二 类 模拟 相对 更 容易 实现 一 些 ， 如 JDK 1.5 引 入 的 
java.util.concurrent 包 ， 实 际 是 由 多 线程 大 师 Doug Lea 开 发 的 一 套 并 发 
包 ， 在 JDK 1.5 出 现 之 前 就 已 经 存在 〈 那 时 候 名 字 叫 做 
dlutilconcurrent， 引 入 JDK 时 由 作者 和 JDK 开 发 团队 共同 做 了 一 些 改 
进 ) ， 所 以 要 在 旧 的 JDK 中 支持 这 部 分 功能 ， 以 独立 类 库 的 方式 便 可 实 
现 。Retrotranslator 中 附带 了 一 个 名 叫 "backport-util-concurrent.jar" 的 类 库 

(由 另 一 个 名 为 "Backport ot JSR 166" 的 项 目 所 提供 ) 来 代替 JDK 1.5 的 








至 于 JDK 在 编译 阶段 进行 处 理 的 那些 改进 ，Retrotranslator 则 是 使 用 
ASM 框 架 直接 对 字 节 码 进行 处 理 。 由 于 组 成 Class 文 件 的 字 节 码 指令 数 
量 并 没有 改变 ， 所 以 无 论 是 JDK 1.3、JDK 1.4 还 是 JDK 1.5， 能 用 字 节 码 
表达 的 语义 范围 应 该 是 一 致 的 。 当 然 ， 肯 定 不 可 能 简单 地 把 Class 的 文件 
版 本 号 从 49.0 改 回 48.0 就 能 解决 问题 了 ， 虽 然 字 节 码 指令 的 数量 没有 变 
化 ， 但 是 元 数据 信息 和 一 些 语 法 文 持 的 内 容 还 是 要 做 相应 的 修改 。 以 枚 
举 为 例 ， 在 JDK 1.5 中 增加 了 enum 关 键 字 ， 但 是 Class 文 件 常量 池 的 
CONSTANT _Class_info 类 型 常量 并 没有 发 生 任何 语义 变化 ， 仍 然 是 代表 
一 个 类 或 接口 的 符号 引用 ， 没 有 加 入 枚 举 ， 也 没有 增加 
过 "CONSTANT_Enum_info" 之 类 的 “ 枚 举 符 号 引用 ?和 常量。 所 以 使 用 
enum 关 键 字 定义 常量 ， 虽 然 从 Java 语 法 上 看 起 来 与 使 用 class 关 键 字 定义 
类 、 使 用 interface 关 键 字 定义 接口 是 同一 层次 的 ， 但 实际 上 这 是 由 Javac 
编译 器 做 出 来 的 假象 ， 从 字 节 码 的 角度 来 看 ， 枚 举 仅仅 是 一 个 继承 于 
java.lang.Enum、 自 动 生成 了 values0 和 valueOfO 方 法 的 普通 Java 类 而 已 。 























Retrotranslator 对 枚 举 所 做 的 主要 处 理 就 是 把 枚 举 类 的 父 类 
从 "java.lang.Enum" 蔡 换 为 它 运 行 时 类 库 中 包含 
的 "net.sf.retrotranslator.runtime.java.lang.Enum_"， 人 然后 再 在 类 和 字段 的 
访问 标志 中 抹 去 ACC_ENUM 标 志 人 位。 当然 ， 这 只 是 处 理 的 总 体 思路 ， 
具体 的 实现 要 比 上 面 说 的 复杂 得 多 。 可 以 想象 既然 两 个 父 类 实现 都 不 一 
样 ，values() 和 valueOf() 的 方法 自然 需要 重 写 ， 常 量 池 需 要 引入 大 量 新 的 
来 日 父 类 的 符 写 引用 ， 这 些 都 是 实现 细节 。 图 9-3 是 一 个 使 用 JDK 1.5 编 





译 的 枚 举 类 与 被 Retrotranslator 转 换 处 理 后 的 字 节 码 的 对 比 图 。 










回 D:\Source\Concole\WebContent \WEPB-IHF\classes\console... [Se 
Wenaral Information Minor version. 0 
由 - 旧 Constant Pool Major version: 人 9 
[者 Interfaces Constant pool courtt : 54 
由 - 蝎 Fields Access flags: 0x4031 [[publie final enunm]] 
由 Methods This class: ep info #1 < fenix/console/domai 
由 -县 Attributes Super class: cp info 相 
Interfaces count: 0 
Fields count: 5 
Methods count: a 
Attributes Count : 2 


了 | 全 imirnac 本 ,本 SP yn ‘Coyvaerctal Fwme ee PP 和 Ey 上 [三 了 







:和 | Minor version. 0 
-Constant Pool 
一 大 Interfaces Constant pool court : Ta 
~ Fields Access flags: 0x0031| [publie final ] 
-DD Methods This class: cp info #2 < fenix/console/domai 
四 -DD Attributes Super class: cp info etre 
Interfaces count - 0 
Fields count : 5 
Methods count: = 
Attributes count: 3 


图 9-3 Retrotranslator 处 理 前 后 的 枚 举 类 字 节 码 对 比 
[1]Retrotranslator 官 方 站 点 : http:/ /retrotranslator.sf.net。 
如果 想 了 解 编译 器 在 这 个 阶段 所 做 的 各 种 动作 的 详细 信息 ， 那 么 可 以 
参考 10.3 节 。 

[3]JSR-133: Java Memory Model and Thread Specification Revision (Java 内 存 


模型 和 线程 规范 修订 ) 





9.3 实战: 目 己 动手 实现 远程 执行 功能 





不 知道 读者 在 做 程序 维护 的 时 候 是 人 否 遇 到 过 这 类 情形 : 排 得 问题 的 
过 程 中 ， 想 碍 看 内 存 中 的 一 些 参数 值 ， 却 又 没有 方法 把 这 些 值 输出 到 界 
面 或 日 志 中 ， 又 或 者 定位 到 茶 个 缓存 数据 有 问题 ， 但 缺少 缓存 的 统一 管 
理 界 面 ， 不 得 不 重启 服务 才能 清理 这 个 缓存 。 类 似 的 需求 有 一 个 共同 的 
特点 ， 那 束 是 只 要 在 服务 中 执行 一 段 程序 代码 ， 就 可 以 定位 或 排除 问 
题 ， 但 就 是 偏偏 找 不 到 可 以 让 服务 器 执行 临时 代码 的 途径， 这 时 候 束 会 
希望 Java 服 务 右 中 也 有 提供 类 似 Groovy Console 的 功能 。 





JDK 1.6 之 后 提供 了 Compiler API， 可 以 动态 地 编译 Java 程 序 ， 虽 然 
这 样 达 不 到 动态 语言 的 灵活 度 ， 但 让 服务 器 执行 临时 代码 的 需求 就 可 以 
得 到 解决 了 。 在 JDK 1.6 之 前 ， 也 可 以 通过 其 他 方式 来 做 到 ， 壁 如 写 一 
个 JSP 文 件 上 传 到 服务 器 ， 然 后 在 浏览 器 中 运行 它 ， 或 者 在 服务 端 程序 
中 加 入 一 个 BeanShell Script、JavaScript 等 的 执行 引擎 〈 如 Mozilla 
Rhinol) 去 执行 动态 脚本 。 在 本 章 的 实战 部 分 ， 我 们 将 使 用 前 面 学 到 
的 关于 类 加 载 及 虚拟 机 执行 子 系统 的 知识 去 实现 在 服务 端 执行 临时 代码 
的 功能 。 





9.3.1 目标 











首先 ， 在 实现 “在 服务 端 执行 临时 代码 ”这 个 需求 之 前 ， 先 来 明确 一 
下 本 次 实战 的 具体 目标 ， 我 们 希望 最 终 的 产品 是 这 样 的 : 


不 依赖 JDK 版 本 ， 能 在 目前 还 普 过 使 用 的 JDK 中 部 普 ， 也 就 是 使 用 


一 /一 


JDK 1.4~JDK 1.7 都 可 以 运行 。 


不 改变 原 有 服务 端 程序 的 部 获 ， 不 依赖 任何 第 三 方 类 库 。 





不 侵入 原 有 程序 ， 即 无 须 改 动 原 程 序 的 任何 代码 ， 也 不 会 对 原 有 程 
序 的 运行 融 来 任何 影响 。 


考 到 BeanShell Script 或 JavaScript 等 脚本 编写 起 来 不 太 方 便 ，“ 临 时 
代码 ”需要 直接 文 持 Java 语 言 。 


“临时 代码 ?应 当 有 具备 足 够 的 目 由 度 ， 不 需要 依赖 特定 的 类 或 实现 特 
定 的 接口 。 这 里 写 的 是 “不 需要 ”而 不 是 “不 可 以 ”， 当 “临时 代码 ?需要 引 
用 其 他 类 库 时 也 没有 限制 ， 只 要 服务 器 程 序 能 使 用 的 ， 临 时 代码 应 当 都 
能 直接 引用 。 








“临时 代码 ”的 执行 结果 能 返回 到 客户 端 ， 执 行 结 采 可 以 包括 程序 中 
输出 的 信息 及 抛 出 的 异常 等 。 





看 完 上 面 列 出 的 目标 ， 你 党 得 完成 这 个 需求 需要 做 多 少 工作 呢 ? 也 
许 答案 比 大 多 数 人 所 想 的 都 要 简单 一 些 : 5 个 类 ，250 行 代码 〈 含 注 
释 ) ， 大 约 一 个 半 小 时 左右 的 开发 时 间 就 可 以 了 ， 现 在 就 开始 编写 程序 





吧 1 


[11]Rhino 站 点 : http://www.mozilla.org/rhino/，Rhino 已 被 收编 入 JDK 1.6 
中 。 


9.3.2 思路 


在 程序 实现 的 过 程 中 ， 我 们 需要 解决 以 下 3 个 问题 : 
如 何 编译 提交 到 服务 器 的 Java 代 码 ? 

如 何 执行 编译 之 后 的 Java 代 码 ? 

如 何 收集 Java 代 码 的 执行 结果 ? 


对 于 第 一 个 问题 ， 我 们 有 两 种 思路 可 以 选择 ， 一 种 是 使 用 tools.jar 
包 (在 Sun JDK/lib 目 录 下 ) 中 的 com.sun.tools.javac.Main 类 来 编译 Java 文 
件 ， 这 其 实 和 使 用 Javac 命 令 编译 是 一 样 的 。 这 种 思路 的 缺点 是 引入 了 
额外 的 JAR 包 ， 而 且 把 程序 “ 绑 死 ”在 Sun 的 JDK 上 了 ， 要 部 署 到 其 他 公司 
的 JDK 中 还 得 把 tools.jar 带 上 (虽然 JRockit 和 J9 虚 拟 机 也 有 这 个 JAR 包 ， 
但 它 总 不 是 标准 所 规定 必须 存在 的 ) 。 另 外 一 种 思路 是 直接 在 客户 端 编 
译 好 ， 把 字 节 码 而 不 是 Java 代 码 传 到 服务 端 ， 这 听 起 来 好 像 有 点 投机 取 
巧 ， 一 般 来 说 确实 不 应 该 假定 客户 端 一 定 具 有 编译 代码 的 能 力 ， 但 是 既 
然 程 序 员 会 号 Java 代 码 去 给 服务 端 排 查 问题 ， 那 么 很 难 想象 他 的 机 器 上 
会 连 编译 Java 程 序 的 环境 都 没有 。 











对 于 第 二 个 问题 ， 简 单 地 一 想 : 要 执行 编译 后 的 Java 人 代码， 让 类 加 
载 锅 加载 这 个 类 生成 一 个 Class 对 象 ， 然 后 反射 调用 一 下 东 个 方法 就 可 以 





了 《因为 不 实现 任何 接口 ， 我 们 可 以 借用 一 下 Java 中 人 人 和 皆 知 

的 "main0" 方 法 )。 但 我 们 还 应 该 考虑 得 更 周全 些 : 一 段 程序 往往 不 是 
编写 、 运 行 一 次 就 能 达到 效果 ， 同 一 个 类 可 能 要 反复 地 修改 、 提 区 、 执 
行 。 另 外 ， 提 交 上 去 的 类 要 能 访问 服务 端的 其 他 类 库 才 行 。 还 有 ， 既 然 
提交 的 是 临时 代码 ， 那 提交 的 Java 类 在 执行 完 后 就 应 当 能 缀 载 和 回收 。 





最 后 的 一 个 问题 ， 我 们 想 把 程序 往 标准 输出 (System.out〉 和 标准 
错误 输出 (System.err) 中 打印 的 信息 收集 起 来 ， 但 标准 输出 设备 是 整 
个 虚拟 机 进程 全 局 共享 的 资源 ， 如 果 使 用 System.setOut()/System.setErr() 
方法 把 输出 流 重 定向 到 自己 定义 的 PrintStream 对 象 上 固然 可 以 收集 输出 
信息 ， 但 也 会 对 原 有 程序 产生 影响 : 会 把 其 他 线程 回 标 准 输出 中 打印 的 
言 轧 也 收集 了 。 虽 然 这 些 并 不 是 不 能 解决 的 问题 ， 不 过 为 了 达到 完全 不 
影响 原 程 序 的 目的 ， 我 们 可 以 采用 另外 一 种 办 法 ， 即 直接 在 执行 的 类 中 
把 对 System.out 的 符号 引用 葵 换 为 我 们 准备 的 PrintStream 的 符号 引用 ， 
依赖 前 面 学 习 的 知识 ， 做 到 这 一 点 并 不 困难 。 














9.3.3 ”实现 


在 程序 实现 部 分 ， 我 们 主要 看 一 下 代码 及 其 注释 。 首 先 看 看 实现 过 
程 中 需要 用 到 的 4 个 支持 类 。 第 一 个 类 用 于 实现 “同一 个 类 的 代码 可 以 被 
多 次 加 载 ” 这 个 需求 ， 即 用 于 解决 9.3.1 节 中 列举 的 第 2 个 问题 的 
HotSwapClassLoader， 具 体 程 序 如 代码 清单 9-3 所 示 。 





代码 清单 9-3 ”HotSwapClassLoader 的 实现 





/** 

* 为 了 多 次 载 入 执行 类 而 加 入 的 加 载 器 br 二 

* 把 qefineClass 方 法 开放 出 来 ， 只 有 外 部 显 式 调用 的 时 候 才 会 使 用 到 1oadByte 方 法 
* 由 虚拟 机 调用 时 ， 仍 然 按 照 原 有 的 双 杀 委派 规则 使 用 1oadclass 方 法 进行 类 加 载 


大 






































*Q@Qauthor zzm 

类 

public class HotSwapClassLoader extends ClLassLoadqer1{ 
public HotSwapClassLoader () { 
号 
} 
也 








uper (HotSwapClassLoaqder .class.detClassLoadqer() ) ; 

















ublic Class loadByte (byte[]classByte) 1 

return defineClass (null,classByte, 0, classByte.length).; 
} 

} 

















HotSwapClassLoader 所 做 的 事情 仅仅 是 公开 父 类 〔 即 
java.lang.ClassLoader) 中 的 protected 方 法 defineClass()， 我 们 将 会 使 用 这 
个 方法 把 提交 执行 的 Java 类 的 byte[] 数 组 转变 为 Class 对 象 。 
HotSwapClassLoader 中 并 没有 重 写 loadClass0) 或 findClass0) 方 法 ， 因 此 如 
果 不 算 外 部 手工 调用 loadByte() 方 法 的 话 ， 这 个 类 加 载 器 的 类 查找 范围 








与 它 的 父 类 加 载 右 是 完全 一 致 的， 在 锐 虚 拟 机 调用 时 ， 它 会 按照 双亲 委 
派 模型 交 给 父 类 加 载 。 构 造 函数 中 指定 为 加 载 HotSwapClassLoader 类 的 
类 加 载 右 作为 父 类 加 载 器 ， 这 一 步 是 实现 提交 的 执行 代码 可 以 访问 服务 
端 引 用 类 库 的 关键 ， 下 面 我们 来 看 看 代码 清单 9-3。 





第 二 个 类 是 实现 将 java.lang.System 蔡 换 为 我 们 自己 定义 的 
HackSystem 类 的 过 程 ， 它 直接 修改 符合 Class 文 件 格式 的 byte[] 数 组 中 的 
常量 池 部 分 ， 将 常量 池 中 指定 内 容 的 CONSTANT _Utf8_info 常 量 蔡 换 为 
新 的 字符 串 ， 具 体 代码 如 代码 清单 9-4 所 示 。ClassModifier 中 涉及 对 
byte[] 数 组 操作 的 部 分 ， 主 要 是 将 byte[] 与 int 和 String 互 相 转 换 ， 以 及 把 
对 byte[] 数 据 的 蔡 换 操作 封装 在 代码 清单 9-5 所 示 的 ByteUtils 中 。 





代码 清单 9-4 ”ClassModifier 的 实现 





/** 

* 修 改 class 文 件 ， 和 暂时 只 提供 修改 当量 池 常 量 的 功能 

*@Qauthor zzm 

A 

public class ClassModifierf{ 

/** 

*Class 文 件 中 常量 池 的 起 始 偏 移 

*/ 

private static final int CONSTANT POOL COUNT INDEX=8; 

/** 

*CONSTANT Utf8 info 常 量 的 tag 标 志 

*/ 

private static final int CONSTANT Utf8 info=1; 

/** 

* 常 量 池 中 11 种 常量 所 占 的 长 度 ，CONSTANT Utf8 info 型 常量 除外 ， 因 为 它 不 是 定 长 的 

下 

private static final int[]CONSTANT ITEM LENGTH={-1, -1, -1, 5, 5, 
9， 9， 3， 3， Dy D， D， 5}; 

private static final int ul=1; 

































































































































































private static final int u2=2; 

private byte[lclassByte; 

public ClassModifier (byte[]classByte) 1 
this.classByte=classByte:; 

} 
/** 
* 修 改 常量 池 中 CONSTANT Utf8 info 常 量 的 内 容 
*Q@param oldStr 修 改 前 的 字符 串 

*Q@param newStr 修 改 后 的 字符 串 
*@return 修 改 结果 

xx 

public byte[]modqifyUTE8Constant (String oldSstr,String newStr) { 
int cpc=getConstantPoolCount () ; 

int offset=CONSTANT POOL COUNT INDEX+u2; 

for (int i=0; i<cpc; i++) { 

int tag=ByteUtils.bytes2Int (classByte,offset,ul). 
E (tag==CONSTANT Utf£f8 info) { 
nt len=ByteUtils.bytes2Int (classByte,offsett+ul, u2); 
ffset+= (ul+u2); 
tring str=ByteUtils.bytes2String (classByte,offset,1len).; 
f (str.equalsIgnoreCase (oldSstr) ) { 
byte[]strBytes=ByteUtils.string2Bytes (newStr); 
byte[]strLen=ByteUtils.int2Bytes (newStr.length(), u2); 
classByte=ByteUtils.bytesReplace (classByte,offset-u2, u2, 
strLen) ; 
classByte=ByteUtils.bytesReplace (classByte,offset,1len,strBytes); 
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return classByte; 
}elselft 
offset+=len:; 

















} 

}elsef{ 

offset+=CONSTANT ITEM LENGTH[tag]; 
} 

} 



































return classByte; 


} 























/** 

* 获 取 常 量 池 中 常量 的 数量 
*@return 常 量 池 数量 

加 

public int getConstantPoolCount () { 
站 全 世 问 下 站 











ByteUtils.bytes2Int (classByte,CONSTANT POOL COUNT INDEX,u2) ; 
} 
} 























代码 清单 9-5 ByteUtils 的 实现 





/** 

*Bytes 数 组 处 理工 具 
xQ@author 
*/ 
public class ByteUtilst 

public static int bytes2Int (byte[]b,int start,int len) { 
int sum=0; 

int end=start+len; 

for (int i=start; i<end; i++) 1 

int n= ( (int) pbp[i]) 性 0xff; 
n=<= (--len) *8; 
sum=n+sum; 

} 

return sunm; 

} 

public static byte[]int2Bytes (int value,int len) { 
byte[]b=new bytellen]; 
for (int i=0; i<len; i++) { 

b[len-i-1]= (byte) ( (value>~>8*i) &0xff),; 
} 


return b; 














































































































public static String bytes2String (byte[]b,int start,int len) { 
return new String (pb,start,len).; 














tic pyte[]string2Bytes (String str) { 
tr.getBytes () ; 


public 

return 

} 

public static byte[]bytesReplace (byte[]originalBytes,int 
offset,int len,byte[]replaceBytes) 1 

byte[jnewBytes=new byteloriginalBytes.length+ 
(replaceBytes.length-len) ]; 

System.arraycopy (originalBytes, 0, newBytes, 0, offset).; 

System.arraycopy (replaceBytes, 0, 
newBytes,offset,replaceBytes.length) ; 

System.arraycopy (originalBytes,offset+len,newBytes,offset+replacet 
offset-1len) ; 

return newBytesS 

} 

} 
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经 过 ClassModifier 处 理 后 的 byte[] 数 组 才 会 传 给 
HotSwapClassLoader.loadByte() 方 法 进行 类 加 载 ，byte[] 数 组 在 这 里 蔡 换 
符号 引用 之 后 ， 与 客户 端 直接 在 Java 代 码 中 引用 HackSystem 类 再 编译 生 
成 的 Class 是 完全 一 样 的 。 这 样 的 实现 既 避 免 了 客户 端 编写 临时 执行 代码 
时 要 依赖 特定 的 类 〈 不 然 无 法 引入 HackSystem) ， 又 避免 了 服务 端 修改 
标准 输出 后 影响 到 其 他 程序 的 输出 。 下 面 我 们 来 看 看 代码 清单 9-4 和 代 
码 清 单 9-5。 








最 后 一 个 类 就 是 前 面 提 到 过 的 用 来 代 蔡 java.lang.System 的 
HackSystem， 这 个 类 中 的 方法 看 起 来 不 少 ， 但 其 实 除 了 把 out 和 err 两 个 
静态 变量 改 成 使 用 ByteArrayOutputStream 作 为 打印 目标 的 同一 个 
PrintStream 对 象 ， 以 及 增加 了 读 取 、 清 理 ByteArrayOutputStream 中 内 容 
的 getBufferString0 和 clearBuffer0 方 法 外 ， 束 再 没有 其 他 新 鲜 的 内 容 了 。 
其 余 的 方法 全 部 都 来 自 于 System 类 的 public 方 法 ， 方 法 名 字 、 参 数 、 返 
回 值 都 完全 一 样 ， 并 且 实 现 也 是 直接 转调 了 System 类 的 对 应 方法 而 已 。 
保留 这 些 方法 的 目的 ， 是 为 了 在 Sytem 被 蔡 换 成 HackSystem 之 后 ， 执 行 
代码 中 调用 的 System 的 其 余 方 法 仍然 可 以 继续 使 用 ，HackSystem 的 实现 
如 代码 清单 9-6 所 示 。 





代码 清单 9-6 HackSystem 的 实现 





/** 
* 为 JavaClass 动 持 java.1lang.System 提 供 支 持 
* 除 了 out 和 err 外 ， 其 余 的 都 直接 转发 给 System 处 理 





























*Q@Qauthor zzm 

4 

public class HackSystemt{ 

public final static InputStream in=System.in; 

private static ByteArrayOutputStream buffer=new 
ByteArrayOutputSstream(); 

public final static PrintStream out=new PrintStream (buf 

public final static PrintStream err=out; 

public static String getBufferString()t 


return buffer.toSstring () ; 









































er); 






















































































public static void clearBuffer() { 
buffer.reset () ; 





























public static void setSecurityManager (final SecurityManager s) 1 
System.setSecurityManager (S) ; 


public static SecurityManager getSecurityManager () { 
return System.getSecurityManager (); 


public static long currentTimeMillis()f{ 
return System.currentTimeMi1llis (); 

















public static void arraycopy (Object src,int srcPos,Object 
dest,int destPos,int lengtn) { 

System.arraycopy (src,srcPos,dest,destPos,length); 

} 

public static int identityHashCode (Object x) { 

return System.identityHashCode (x) ; 

} 

// 下 面 所 有 的 方法 都 与 java .1lang .System 的 名 称 一 样 

// 实 现 都 是 字 节 转调 System 的 对 应 方法 

// 因 版 面 原 因 ， 省 略 了 其 他 方法 

} 










































































至 此 ，4 个 文 持 类 已 经 讲解 完毕 ， 我 们 来 看 看 最 后 一 个 类 
JavaClassExecuter， 它 是 提供 给 外 部 调用 的 入 口 ， 调 用 前 面 几 个 支持 类 
组 装 逻 辑 ， 完 成 类 加 载 工 作 。JavaClassExecuter 只 有 一 个 execute() 方 
法 ， 用 输入 的 符合 Class 文 件 格式 的 byte[] 数 组 蔡 换 java.lang.System 的 符 
号 引用 后 ， 使 用 HotSwapClassLoader 加 载 生成 一 个 Class 对 象 ， 由 于 每 次 


执行 execute() 方 法 都 会 生成 一 个 新 的 类 加 载 器 实例 ， 因 此 同一 个 类 可 以 
实现 重复 加 载 。 然 后 ， 反 射 调用 这 个 Class 对 象 的 main() 方 法 ， 如 果 期 间 
出 现任 何 异 常 ， 将 异常 信息 打印 到 HackSystem.out 中 ， 最 后 把 缓冲 区 中 
的 信息 作为 方法 的 结果 返回 。JavaClassExecuter 的 实现 代码 如 代码 清单 
9-7 所 示 。 


代码 清 单 9-7 JavaClassExecuter 的 实现 





/** 
x*JavaClass 执 行 工 具 


大 





xQ@author zzm 

yf 

public class JavaClassExecuterf{ 

/** 

* 执 行 外 部 传 过 来 的 代表 一 个 Java 类 的 pyte 数 组 <br> 

* 将 输入 类 的 byte 数 组 中 代表 java.lang.System 的 CONSTANT Utf8 info 常 量 修 改 为 
动 持 后 的 HackSystem 类 

* 执 行 方法 为 该 类 的 static main (String[]args) 方法 ， 输 出 结果 为 该 类 向 
System.out/err 输 出 的 信息 

*@param classByte 代 表 一 个 Java 类 的 byte 数 组 

*@return 执 行 结 

* 

public static String execute (byte[]classByte) { 

HackSystem.clearBuffer () ; 
ClassModifier cm=new ClassModifier (classByte) ; 
byte[]modiBytes=cm.modifyUTF8Constant ("java/lang/System", "org/fer 
HotSwapClassLoader loader=new HotSwapClassLoader () ; 
Class clazz=loader.loadByte (modiBytes); 

tryl 

Method method=clazz.getMethod ("main", new Class [] 
{String[] .class}); 

method.invoke (null,new String[] {null}). 

}catch (Throwable e) 1 

e.printStackTrace (HackSystem.out).; 

} 

return HackSystem.getBufferString () ; 

} 

} 





























































































































9.3.4 “验证 


远程 执行 功能 的 编码 到 此 就 完成 了 ， 接 下 来 就 要 检验 一 下 我 们 的 劳 
动 成 果 了 。 如 果 只 是 测试 的 话 ， 那 么 可 以 任意 写 一 个 Java 类 ， 内 容 无 所 
谓 ， 只 要 向 System.out 笨 出 信息 即 可 ， 取 名 为 TestClass， 同 时 放 到 服务 
器 C 盘 的 根 目录 中 。 然 后 ， 建 立 一 个 JSP 文 件 并 加 入 如 代码 清单 9-8 所 示 
的 内 容 ， 就 可 以 在 浏览 器 中 看 到 这 个 类 的 运行 结果 了 。 





代码 清单 9-8 测试 JSP 





<gsepage import="java.lang.*"%> 

<gsepage import="java.io.*"$> 

<gsepagde import="org.fenixsoft.classloading.execute.*"$%> 
一 

InputStream is=new FileInputStream ("c:/TestClass.class") ; 
byte[l]b=new bytel[is.available()|]; 

is.read (pb) ; 

js.close(); 




















out.println ("<textarea style='width:1000; height=800'>"),， 
out.println (JavaClassExecuter.execute (b) ) ; 
tln ("</textarea>").,; 























当然 ， 上 面 的 做 法 只 是 用 于 测试 和 演示 ， 实 际 使 用 这 
JavaExecuter 执 行 强 的 时 候 ， 如 果 还 要 手工 复制 一 个 Class 文 件 到 服务 器 
上 就 没有 什么 意义 了 。 笔 者 给 这 个 执行 器 写 了 一 个 “外 壳 "， 是 一 个 
Eclipse 插件 ， 可 以 把 Java 文 件 编译 后 传输 到 服务 句 中 ， 然 后 把 执行 堪 的 

结果 输出 到 Eclipse 的 Console 窗 口 里 ， 这 样 就 可 以 在 有 灵感 的 时 候 





简单 ， 但 效果 很 不 错 ， 对 调试 问题 也 非常 有 用 ， 如 图 9-4 所 示 。 


六 test 
; [3 com 
el yefmis | 
[D RemoteT 


园 testold 
民 . classpath 


园 .Project 





喇 build. prop 





Refresh Tasks Ctrl+F5 
Apply Checkstyle fixes 

Run As 

Debue As 

Profile As | eR i 
在 服务 器 上 运行 | Fenix 192.168.32.62 





二 ] 


图 9-4 JavaClassExecutet 的 使 用 


9.4 ”本章 小 结 


本 书 第 6~9 章 介绍 了 Class 文 件 格式 、 类 加 载 及 虚拟 机 执行 引擎 几 部 
分 内 容 ， 这 些 内 容 是 虚拟 机 中 必 不 可 少 的 组 成 部 分 ， 只 有 了 解 了 虚拟 机 
如 何 执行 程序 ， 才 能 更 好 地 理解 怎样 写 出 优秀 的 代码 。 


关于 虚拟 机 执行 子 系统 的 介绍 到 此 融 结 束 了 ， 通 过 这 4 章 的 讲解 ， 
我 们 描绘 了 一 个 虚拟 机 应 该 怎样 运行 Class 文 件 的 概念 模型 。 对 于 具体 到 
菏 个 虚拟 机 的 实现 ， 为 了 使 实现 简单 、 清 晰 ， 或 者 为 了 更 快 的 运行 速 
度 ， 在 虚拟 机 内 部 的 运作 跟 概念 模型 可 能 会 有 非常 大 的 差异 ， 但 从 最 终 
的 执行 结果 来 看 应 该 是 一 致 的 。 从 第 10 章 开始 ， 我 们 将 探索 虚拟 机 在 语 
法 和 运行 性 能 上 是 如 何 对 程序 编写 做 出 各 种 优化 的 。 








第 四 部 分 ”程序 编译 与 代码 优化 
第 10 章 早期 (编译 期 ) 优化 


第 11 章 ”晚期 (运行 期 ) 优化 


第 10 章 ”早期 (编译 期 ) 优化 





从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 退 求 就 是 程序 天 生 的 坚定 
信仰 ， 这 个 过 程 犹 如 一 场 没有 终点 、 永 不 停 敬 的 F1 方 程式 竞赛 ,程序 员 
是 车 手 ， 技 术 平 台 则 是 在 赛 道上 飞驰 的 赛车 。 





10.1 概述 


Java 语 言 的 “编译 期 ?其 实 是 一 段 “不 确定 ”的 操作 过 程 ， 因 为 它 可 能 
是 指 一 个 前 端 编译 器 《其实 叫 “ 编 译 器 的 前 只 ? 更 准确 一 些 ) 把 *.java 文 
件 转变 成 *.class 文 件 的 过 程 ， 也 可 能 是 指 虚 拟 机 的 后 端 运 行 期 编译 器 
(JIT 编 译 器 ，Just In Time Compiler) 把 字 节 码 转 变 成 机 器 码 的 过 程 ; 

可 能 是 指使 用 静态 提前 编译 器 〈AOT 编 译 器 ，Ahead Of Time 
Compiler) 直接 把 *.java 文 件 编译 成 本 地 机 器 代码 的 过 程 。 下 面 列举 了 这 

类 编译 过 程 中 一 些 比较 有 代表 性 的 编译 器 。 





前 端 编译 器 : Sun 的 Javac、Eclipse JDT 中 的 增 量 式 编译 器 
(ECJ) (1, 


JIT 编 译 器 : HotSpot VM 的 C1、C2 编 译 器 。 


AOT 编 译 器 : GNU Compiler for the Java (GCJ) ("|、Excelsior 


JETI]。 





这 3 类 过 程 中 最 符合 大 家 对 Java 程 序 编译 认 知 的 应 该 是 第 一 类 ， 在 
本 章 的 后 续 文 字 里 ， 笔 者 提 到 的 “编译 期 ?和 “编译 器 ”都 仅 限 于 第 一 类 纺 
译 过 程 ， 把 第 二 类 编译 过 程 留 到 下 一 章 中 讨论 。 限 制 了 编译 范围 后 ， 我 
们 对 于 “优化 ”三 字 的 定义 就 需要 宽松 一 些 ， 因 为 Javac 这 类 编译 占 对 代码 
的 运行 效率 几乎 没有 任何 优化 措施 (在 JDK 1.3 之 后 ，Javac 的 -O 优 化 参 
数 就 不 再 有 意义 ) 。 虚 拟 机 设计 团队 把 对 性 能 的 优化 集中 到 了 后 端的 即 
时 编译 器 中 ， 这 样 可 以 让 那些 不 是 由 Javac 产 生 的 Class 文 件 〈《 如 JRuby、 
Groovy 等 语言 的 Class 文 件 ) 也 同样 能 齐 受 到 编译 喜 优 化 所 带 来 的 好 
处 。 但 是 Javac 做 了 许多 针对 Java 语 言 编码 过 程 的 优化 措施 来 改善 程序 员 
的 编码 风格 和 提高 编码 效率 。 相 当 多 新 生 的 Java 语 法 特性 ， 都 是 靠 编译 
强 的 “语法 糖 * 来 实现 ， 而 不 是 依赖 虚拟 机 的 后 层 改 进来 支持 ， 可 以 说 ， 
Java 中 即时 编译 需 在 运行 期 的 优化 过 程 对 于 程序 运行 来 说 更 重要 ， 而 前 
端 编 译 器 在 编译 期 的 优化 过 程 对 于 程序 编码 来 说 天 系 更 加 密切 。 


























[IJDT 官 方 站 点 : http://www.eclipse.org/jdt/。 
DPIGCJ 官 方 站 点 : http://gcc.gnu.otg/java/。 


[3]Excelsior JET 官 方 站 点 : http://www.excelsior-usa.com/。 


10.2 Javac 编 译 器 


分 析 源 码 是 了 解 一 项 技术 的 实现 内 幕 最 有 效 的 手段 ，Javac 编 译 需 
不 像 HotSpot 虚 拟 机 那样 使 用 C++ 语言 《包含 少量 C 语 言 ) 实现 ， 它 本 刁 
就 是 一 个 由 Java 语 言 编写 的 程序 ， 这 为 纯 Java 的 程序 员 了 解 它 的 编译 过 
程 融 来 了 很 大 的 便利 。 











10.2.1 Javac 的 源码 与 调试 


Javac 的 源码 存放 在 
JDK_SRC_HOME/langtools/src/share/classes/com/sun/tools/javac 中 tJ， 除 
了 JDK 自 身 的 API 外 ， 就 只 引用 了 
JDK_SRC_HOME/langtools/src/share/classes/com/sun* 里 面 的 代码 ， 调 试 
环境 建立 起 来 简单 方便 ， 因 为 基本 上 不 需要 处 理 依赖 关系 。 


以 Eclipse IDE 环 境 为 例 ， 先 建立 一 个 名 为 "Compiler_javac" 的 Java 工 
程 ， 然 后 把 JDK_SRC_HOME/langtools/src/share/classes/comy/sun/* 目录 下 
的 源 文件 全 部 复制 到 工程 的 源码 目录 中 ， 如 图 10-1 所 示 。 


卢 Package Explorer | = 


| 说 Compiler javac | 
bp ES .settings 
Db EE bin 
4 人 -src 
4 1 com 
4 $3 sun 
>» 芝 javadoc 
> nirror 
b> 1 souree 
> 久 tools 
b> Er org 
呈 . classpath 
后] .project 








图 10-1 Eclipse 中 的 Javac 工 程 
导入 代码 期 间 ， 源 码 文件 "AnnotationProxy Maker.java" 可 能 会 提 


示 "Access Restriction"， 被 Eclipse 拒绝 编译 ， 如 图 10-2 所 示 。 


Y for an annotation mirror. 


private Annotation generateAnnotation(}) { 


return Annotatiohparser.annotationForMap (annoType,. 


Vv 


咱 OAccess restriction: The method annotationForlMap (Class, Nap<Strine, Object>) 3 
BrmotationFarser is not accessible due to restriction on required library 
D:\_DevSpace\jdkl.6.0 21\jre\lib\rt. jar 





图 10-2 AnnotationProxyMaket 被 拒绝 编译 


这 是 由 于 Eclipse 的 JRE System Library 中 默认 包含 了 一 系列 的 代码 访 


问 规则 (Access Rules) ， 如 果 代 码 中 引用 了 这 些 访问 规则 所 禁止 引用 
的 类 ， 就 会 提示 这 个 错误 。 可 以 通过 添加 一 条 人 允许 访问 JAR 包 中 所 有 类 
的 访问 规则 来 解决 这 个 问题 ， 如 图 10-3 所 示 。 


Java Build Path 


C3 Source | 本 Projects| Bh Libraries | ~ Order and Export 
JARs and class folders on the build path: 


yment descriptc 


2 JEE System Library [JavaSE-1.6] 


SE Access rules: 1 rules[(s) defined added to al 


Hative library location: (None) 
Ia resources. jar -— D:\ DevSpace\jdkl. 8.0 21\Yee\- 
二 Dasc BD sh 


y '@: Type Access Ruies 





Specify access rules for the library ' JRE System Library | 
[JavaSE-1.6]. 

When accessine a type in a library child entry, these rules are 
processed top down until a rule pattern matches. When no pattern 
matches, the rules defined for library child entry are taken. 


| 
| 

Access rules: pl 
| 




















图 10-3 设置 访问 规则 


导入 了 Javac 的 源码 后 ， 就 可 以 运行 com.sun.tools.javac.Main 的 main() 
方法 来 执行 编译 了 ， 与 命令 行 中 使 用 Javac 的 命令 没有 什么 区 别 ， 编 译 
的 文件 与 参数 在 Eclipse 的 "Debug Configurations" 面 板 中 的 "Arguments" 页 
签 中 指定 。 


虚拟 机 规范 严格 定义 了 Class 文 件 的 格式 ， 但 是 《Java 虚 拟 机 规范 
《第 2 版 ) 》 中 ， 虽 然 有 专门 的 一 章 "Compiling for the Java Virtual 


Machine"， 但 都 是 以 举例 的 形式 描述 ， 并 没有 对 如 何 把 Java 源 码 文件 转 
变 为 Class 文 件 的 编译 过 程 进 行 十 分 严格 的 定义 ， 这 导致 Class 文 件 编译 
在 某 种 程度 上 是 与 具体 JDK 实 现 相 关 的 ， 在 一 些 极端 情况 ， 可 能 出 现 一 
段 代 码 Javac 编 译 器 可 以 编译 ， 但 是 ECJ 编 译 器 就 不 可 以 编译 的 问题 

《10.3.1 节 中 将 会 给 出 这 样 的 例子 ) 。 从 Sun Javac 的 代码 来 看 ， 编 译 过 





解析 与 填充 符号 表 过 程 。 


插入 式 注解 处 理 器 的 注解 处 理 过 程 。 


分 析 与 字 节 码 生成 和 
Analyse and Generate 
1010 


图 10-4 Javac 的 编译 过 程 中 





PO i 

过 程 的 代码 逻辑 集中 在 这 个 类 的 compile() 和 compile20 方 法 中 ， 其 

中 主体 代码 如 图 10-5 所 示 ， 整 个 编译 最 关键 的 处 理 就 由 图 中 标注 的 8 个 
方法 来 完成 ， 下 面 我 们 具体 看 一 下 这 8 个 方法 实现 了 什么 功能 





准备 过 程 : 初始 化 插入 式 注解 处 理 器 
i/ These method calls must be chained to avoid memory leaks 
delegateCompiler = 
processAnnotations 过 程 2: 执行 注解 处 理 
StopPIEError{CompileState .PaRSE, 一 ~ 过 程 1.2: 输入 到 符号 表 
sourceFileObject3}}}， 一 > 过 程 1.1: 词法 分 析 、 语 法 分 析 


classnaemes}; 


delegateCompiler.compile2{); 一 一 > 过 程 3: 分 析 及 字 节 码 生 成 


case BY TODO: 
while {'‘'todo.isEmpty{)) 


ee 本 ao 


Preak: 


过 程 3.4: 生成 字 节 码 过 程 3.3: 解 语法 糖 过 程 3.2: 数据 流 分 析 过 程 3.1: 标注 





图 10-5 Javac 编 译 过 程 的 主体 代码 
[1 关于 如 何 获取 OpenJDK 源 码 ， 请 参考 本 书 第 1 章 。 
[图片 来 源 : http://openjdk.java.net/groups/compiler/doc/compilation- 
overview/index.html， 本 书 对 相关 术语 进行 了 翻译 。 





解析 步骤 由 图 10-5 中 的 parseFiles0) 方 法 〈 图 10-5 中 的 过 程 1.1) 完 
成 ， 解 析 步 骤 包 括 了 经 典 程序 编译 原理 中 的 词法 分 析 和 语法 分 析 两 个 过 


程 。 
1. 词 法 、 语 法 分 析 


词法 分 析 是 将 源 代码 的 字符 流转 变 为 标记 〈Token) 集合 ， 单 个 字 
符 是 程序 编写 过 程 的 最 小 元 素 ， 而 标记 则 是 编译 过 程 的 最 小 元 素 ， 关 键 
字 、 变 量 名 、 字 面 量 、 运 算 符 都 可 以 成 为 标记 ， 如 "int a=b+2" 这 人 句 代 但 
包含 了 6 个 标记 ， 分 别 是 int、a、=、b、+、2， 虽 然 关键 字 int 由 3 个 字符 
构成 ， 但 是 它 只 是 一 个 Token， 不 可 再 拆 分 。 在 Javac 的 源码 中 ， 词 法 分 


析 过 程 由 com.sun.tools.javac.parser.Scanner 类 来 实现 。 




















语法 分 析 是 根据 Token 序 列 构造 抽象 语法 树 的 过 程 ， 抽 象 语 法 树 
(Abstract Syntax Tree,AST) 是 一 种 用 来 描述 程序 代码 语法 结构 的 树 形 
表示 方式 ， 语 法 树 的 每 一 个 节点 都 代表 着 程序 代码 中 的 一 个 语法 结构 
《Construct) ， 例 如 包 、 类 型 、 修 饰 符 、 运 算 符 、 接 口 、 返 回 值 甚至 代 
码 注释 等 都 可 以 是 一 个 语法 结构 。 


图 10-6 是 根据 Eclipse AST View 插 件 分 析出 来 的 某 段 代码 的 抽象 语 


法 树 视 图 ， 读 者 可 以 通过 这 张 图 对 抽象 语法 树 有 一 个 直观 的 认识 。 在 
Javac 的 源码 中 ， 语 法 分 析 过 程 由 com.sun.tools.javac.parser.Parser 类 实 
现 ， 这 个 阶段 产 出 的 抽象 语法 树 由 com.sun.tools.javac.tree.JCTree 类 表 
示 ， 经 过 这 个 步骤 之 后 ， 编 译 器 就 基本 不 会 再 对 源码 文件 进行 操作 了 ， 
后 续 的 操作 都 建立 在 抽象 语法 树 之 上 。 































ortRedirectServer. java (AST Level 本 sp rp 1B ms. 一 
| 全 | 男 唱和 所 
; PACKAGE 
» INPFORTS (8) 
4 TIFES (1) 
4 TypeDeclaration [342, i1493] 
» > type bindine' org. fenixsoft. net. PortRedirectServer 
JAVYADOC: null 
,MODIFIERS (1) 
INTERFACE: ' false’ 
» NAME 
TYPE PARAMETERS (0) 
SUPERCLASS_TYPE: roll 
; SUPFER INTERFAMCE_ TYPES (1) 
a BODY DECLARATIONS (5) 
; Fieldheclaration [397, 32] 
, FieldDeclaration [43#, 75] 
， 吉 ethodDeclaration [Si4, 1131] 
; 角 ethodheclaration [i650, 75] 
,MethodDeclaration [iT30, 102] 
> CompilationlUnit: or 区 fenixsoft. Pet. PortRedirectoerver., 1 ava 
;> comments 三 ) 
> compiler problems 如) 
;> AST settines 
;> RESOLVE WELL FHNOWH_ TYPES 





图 10-6 抽象 语法 树 结 构 视 图 


2. 填 充 符号 表 





完成 了 语法 分 析 和 词法 分 析 之 后 ， 下 一 步 就 是 填充 符号 表 的 过 程 ， 

也 就 是 图 10-5 中 enterTrees(0) 方 法 〈 图 10-5 中 的 过 程 1.2) 所 做 的 事情 。 符 
号 表 (Symbol Table) 是 由 一 组 符号 地 址 和 符号 信息 构成 的 表格 ， 读 者 
可 以 把 它 想 象 成 哈 希 表 中 K-V 值 对 的 形式 〈 实 际 上 符号 表 不 一 定 是 哈 希 
表 实 现 ， 可 以 是 有 序 符号 表 、 树 状 符号 表 、 栈 结构 符号 表 等 ) 。 符 号 表 
中 所 登记 的 信息 在 编译 的 不 同 阶段 都 要 用 到 。 在 语义 分 析 中 ， 符 号 表 所 
登记 的 内 容 将 用 于 语义 检查 〈 如 检查 一 个 名 字 的 使 用 和 原先 的 说 明 是 否 
一 致 ; 和 产生 中 间 人 代码。 在 目标 代码 生成 阶段 ， 当 对 符号 名 进行 地 址 分 
配 时 ， 符 号 表 是 地 址 分 配 的 依据 。 
































在 Javac 源 代码 中 ， 填 充 符 号 表 的 过 程 由 
com.sun.tools.javac.comp.Enter 类 实现 ， 此 过 程 的 出 口 是 一 个 待 处 理 列表 
(To Do List) ， 包 含 了 每 一 个 编译 单元 的 抽象 语法 树 的 顶级 节点 ， 以 

及 package-info.java《〈《 如 果 存 在 的 话 ) 的 顶级 节点 。 


10.2.3 ”注解 处 理 器 


在 JDK 1.5 之 后 ，Java 语 言 提 供 了 对 注解 (Annotation〉 的 支持 ， 这 
些 注解 与 普通 的 Java 代 码 一 样 ， 是 在 运行 期 间 发 挥 作用 的 。 在 JDK 1.6 中 
实现 了 JSR-269 规 范 帆 ， 提 供 了 一 组 插入 式 注解 处 理 器 的 标准 API 在 编译 
期 间 对 注解 进行 处 理 ， 我 们 可 以 把 它 看 做 是 一 组 编译 器 的 插件 ， 在 这 些 
插件 里 面 ， 可 以 读 取 、 修 改 、 添 加 抽象 语法 树 中 的 任意 元 素 。 如 果 这 些 
插件 在 处 理 注解 期 间 对 语法 树 进 行 了 修改 ， 编 译 器 将 回 到 解析 及 填充 符 
号 表 的 过 程 重 新 处 理 ， 直 到 所 有 插入 式 注解 处 理 器 都 没有 再 对 语法 树 进 
行 修改 为 止 ， 每 一 次 循环 称 为 一 个 Round， 也 就 是 图 10-4 中 的 回环 过 


程 。 








有 了 编译 器 注解 处 理 的 标准 API 后 ， 我 们 的 代码 才 有 可 能 干涉 编译 
需 的 行为 ， 由 于 语法 树 中 的 任意 元 系 ， 甚 至 包括 代码 注释 都 可 以 在 插件 
之 中 访问 到 ， 所 以 通过 插入 式 注解 处 理 器 实现 的 插件 在 功能 上 有 很 大 的 
发 挥 空 间 。 只 要 有 足够 的 创意 ， 程 序 员 可 以 使 用 插入 式 注 解 处 理 器 来 实 
现 许多 原本 只 能 在 编码 中 完成 的 事情 ， 本 章 最 后 会 给 出 一 个 使 用 插入 式 
注解 处 理 右 的 简单 实战 。 











在 Javac 源 码 中 ， 插 入 式 注解 处 理 器 的 初始 化 过 程 是 在 
initPorcessAnnotations() 方 法 中 完成 的 ， 而 它 的 执行 过 程 则 是 在 


processAnnotations() 方 法 中 完成 的 ， 这 个 方法 判断 是 否 还 有 新 的 注解 处 
理 絮 需要 执行 ， 如 果 有 的 话 ， 通 过 
com.sun.tools.javac.processing.JavacProcessingEnvironment 类 的 
doProcessing() 方 法 生成 一 个 新 的 JavaCompiler 对 象 对 编译 的 后 续 步 又 进 
行 处 理 。 


[1]JSR-269: Pluggable Annotations Processing API (插入 式 注 解 处 理 
API) 。 


10.2.4 语义 分 析 与 字 节 人 码 生 成 


语法 分 析 之 后 ， 编 译 器 获得 了 程序 代码 的 抽象 语法 树 表 示 ， 语 法 树 
能 表示 一 个 结构 正确 的 源 程序 的 抽象 ， 但 无 法 保证 源 程序 是 符合 逻辑 
的 。 而 语义 分 析 的 主要 任务 是 对 结构 上 正确 的 源 程序 进行 上 下 文 有 关 性 
质 的 审查 ， 如 进行 类 型 审查 。 举 个 例子 ， 假 设 有 如 下 的 3 个 变量 定义 语 
句 ]: 





int a=1; 
boolean b=false:; 
char c=2; 





后 续 可 能 出 现 的 赋值 运算 : 


int d=atc; 
int d=b+c; 
char d=a+tc; 








后 续 代 码 中 如 果 出 现 了 如 上 3 种 赋值 运算 的 话 ， 那 它们 都 能 构成 结 
构 正 确 的 语法 树 ， 但 是 只 有 第 1 种 的 写法 在 语义 上 是 没 有 问题 的 ， 能 够 
通过 编译 ， 其 余 两 种 在 Java 语 言 中 是 不 合 馆 辑 的 ， 无 法 编译 《是 否 合乎 
语义 逻辑 必须 限定 在 具体 的 语言 与 具体 的 上 下 文 环境 之 中 才 有 意义 。 如 
在 C 语 言 中 ，a、b、c 的 上 下 文 定义 不 变 ， 第 2、3 种 写法 都 是 可 以 正确 纺 


译 )。 








1. 标 注 检查 


Javac 的 编译 过 程 中 ， 语 义 分 析 过 程 分 为 标注 检查 以 及 数据 及 控制 
流 分 析 两 个 步骤 ， 分 别 由 图 10-5 中 所 示 的 attribute0 和 flow0) 方 法 〈 分 别 
对 应 图 10-5 中 的 过 程 3.1 和 过 程 3.2) 完成 。 





标注 检查 步 又 检查 的 内 容 包 括 诸如 变量 使 用 前 是 售 己 被 声 明 、 变 量 
与 赋值 之 间 的 数据 类 型 是 售 能 够 匹配 等 。 在 标注 检查 步骤 中 ， 还 有 一 个 
重要 的 动作 称 为 第 量 折 合 ， 如 果 我 们 在 代码 中 写 了 如 下 定义 : 








int a=1+2; 








那么 在 语法 树 上 仍然 能 看 到 字面 量 *1*、“2” 以 及 操作 符 “+”， 但 是 
在 经 过 常量 折 苇 之 后 ， 它 们 将 会 被 折 邯 为 字面 量 “3”， 如 图 10-7 所 示 ， 
这 个 插入 式 表 达 式 (Infix Expression〉 的 值 已 经 在 语法 树 上 标注 出 来 了 
(ConstantExpressionValue:3) 。 由 于 编译 期 间 进 行 了 常量 折合 ， 所 以 在 
代码 里 面 定 义 "a=1+2" 比 起 直接 定义 "a=3"， 并 不 会 增加 程序 运行 期 哪怕 
仅仅 一 个 CPU 指 令 的 运算 量 。 





a INITIALIZER 
4 InfixExpression [105, 5] 
4 > [Expression) type bindine: int 
NANME: “int’ 
REY EE: 
IS RECOVERED: false 
QUALIFIED NANME: ”int” 
KINI: isPrimitive 
CREATE ARRAY TYFE (+1): int[] 
BINARY HAME: “I* 
AHNOTATIONS (0) 
>iava element: null 
Boxine: false; Unboxlng: false 
ConstantExpressionyalue; 3 
4 LEFT OFERAND 
HumberLiteral [105, 1] 
OPERATOR: “十 
4 RIGHT OPERMED 
HumberLiteral [109, 1] 





图 10-7 常量 折 坡 





标注 检查 步骤 在 Javac 源 码 中 的 实现 类 是 


com.sun.tools.javac.comp.Attr 类 和 com.sun.tools.javac.comp.Check 类 。 


2. 数 据 及 控制 流 分 析 





数据 及 控制 流 分 析 是 对 程序 上 下 文 逻辑 更 进一步 的 验证 ， 它 可 以 检 
碍 出 诺 如 程序 局 部 变量 在 使 用 前 是 否 有 赋值 、 方 法 的 每 条 路 径 是 否 都 有 
返回 值 、 是 否 所 有 的 受 查 异常 都 被 正确 处 理 了 等 问题 。 编 译 时 期 的 数据 
及 控制 流 分 析 与 类 加 载 时 的 数据 及 控制 流 分 析 的 目的 基本 上 是 一 致 的 ， 
但 校 验 范 围 有 所 区 别 ， 有 一 些 校 验 项 只 有 在 编译 期 或 运行 期 才能 进行 。 














下 面 举 一 个 天 于 final 修 饰 符 的 数据 及 控制 流 分 析 的 例子 ， 见 代码 清单 10- 
1。 


代码 清单 10-1 final 语 义 校 验 








// 方 法 一 带 有 final 修 饰 

public void foo (final int arg) 1 
final int var=0; 

//do something 


























} 

// 方 法 二 没有 final 修 饰 

public void foo (int arg) 1 
int var=0; 

//do something 

} 

















在 这 两 个 foo() 方 法 中 ， 第 一 种 方法 的 参数 和 局 部 变量 定义 使 用 了 
final 修 饰 符 ， 而 第 二 种 方法 则 没有 ， 在 代码 编写 时 程序 肯定 会 受到 final 
修饰 符 的 影响 ， 不 能 再 改变 arg 和 var 变 量 的 值 ， 但 是 这 两 段 代 码 编译 出 
来 的 Class 文 件 是 没有 任何 一 点 区 别 的 ， 通 过 第 6 章 的 讲解 我 们 已 经 知 
道 ， 局 部 变量 与 字段 (实例 变量 、 类 变量 ) 是 有 区 别 的 ， 它 在 常量 池 中 
没有 CONSTANT_Fieldref info 的 符号 引用 ， 自 然 就 没有 访问 标志 
(Access_Flags) 的 信息 ， 甚 至 可 能 连 名 称 都 不 会 保留 下 来 (取决 于 编 
译 时 的 选项 ) ， 自 然 在 Class 文 件 中 不 可 能 知道 一 个 局 部 变量 是 不 是 声明 
为 final 了 。 因 此 ， 将 局 部 变量 声明 为 fnal， 对 运行 期 是 没有 影响 的 ， 变 
量 的 不 变性 仅仅 由 编译 器 在 编译 期 间 保障 。 在 Javac 的 源码 中 ， 数 据 及 
控制 流 分 析 的 入 口 是 图 10-5 中 的 flow0 方 法 (对 应 图 10-5 中 的 过 程 
































3.2) ， 具 体操 作 由 com.sun.tools.javac.comp.Flow 类 来 完成 。 
3. 解 语法 糖 


语法 糖 (Syntactic Sugar) ， 也 称 糖衣 语法 ， 是 由 英国 计算 机 科学 
家 彼得 .约翰 : 兰 达 (PeterJLandin) 发 明 的 一 个 术语 ， 指 在 计算 机 语言 
中 添加 的 某 种 语法 ， 这 种 语法 对 语言 的 功能 并 没有 影响 ， 但 是 更 方便 程 
序 员 使 用 。 通 常 来 说 ， 使 用 语法 糖 能 够 增加 程序 的 可 读 性 ， 从 而 减少 程 
序 代码 出 错 的 机 会 。 


Java 在 现代 编程 语言 之 中 属于 “低糖 语言 ”( 相 对 于 C# 及 许多 其 他 
JVM 语 言 来 说 ) ， 尤 其 是 JDK 1.5 之 前 的 版 本 , “低糖 ”语法 也 是 Java 语 言 
被 怀疑 已 经 “落后 ”的 一 个 表面 理由 。Java 中 最 常用 的 语法 糖 主要 是 前 面 
提 到 过 的 泛 型 〈 泛 型 并 不 一 定 都 是 语法 糖 实现 ， 如 C# 的 泛 型 就 是 直接 由 
CLR 文 持 的 ) 、 变 长 参数 、 自 动 装 箱 / 拆 箱 等 ， 虚 拟 机 运行 时 不 支持 这 
些 语法 ， 它 们 在 编译 阶段 还 原 回 简单 的 基础 语法 结构 ， 这 个 过 程 称 为 解 
语法 糖 。Java 的 这 些 语 法 糖 被 解除 后 是 什么 样子 ， 将 在 10.3 节 中 详细 讲 


在 Javac 的 源码 中 ， 解 语法 糖 的 过 程 由 desugar0 方 法 触发 ， 在 
com.sun.tools.javac.comp.TransTypes 类 和 com.sun.tools.javac.comp.Lower 


类 中 完成 。 


4. 字 市 码 生 成 


字 节 和 码 生成 是 Javac 编 译 过 程 的 最 后 一 个 阶段 ， 在 Javac 源 码 里 面 由 
com.sun.tools.javac.jvm.Gen 类 来 完成 。 字 市 码 生 成 阶段 不 仪 仪 是 把 前 面 
各 个 步骤 所 生成 的 信息 《语法 树 、 符 号 表 ) 转化 成 字 节 码 写 到 磁盘 中 ， 
编译 器 还 进行 了 少量 的 代码 添加 和 转换 工作 。 











例如 ， 前 面 章节 中 多 次 提 到 的 实例 构造 器 <<init>() 方 法 和 类 构造 器 
<clinit>() 方 法 就 是 在 这 个 阶段 添加 到 语法 树 之 中 的 《〈 广 意 ， 这 里 的 实 
例 构 造 器 并 不 是 指 默认 构造 函数 ， 如 果 用 户 代 码 中 没有 提供 任何 构造 函 
数 ， 那 编译 器 将 会 添加 一 个 没有 参数 的 、 访 问 性 (public、protected 或 
private) 与 当前 类 一 致 的 默认 构造 函数 ， 这 个 工作 在 填充 符号 表 阶 段 就 
己 经 完成 ) ， 这 两 个 构造 器 的 产生 过 程 实际 上 是 一 个 代码 收敛 的 过 程 ， 
编译 器 会 把 语句 块 〈 对 于 实例 构造 器 而 言 是 “{}” 块 ， 对 于 类 构造 器 而 言 
是 "static{}" 块 ) 、 变 量 初始 化 《实例 变量 和 类 变量 ) 、 调 用 父 类 的 实例 
构造 器 (仅仅 是 实例 构造 器 ， 二 dinit>>0 方 法 中 无 须 调用 父 类 的 二 clinit 
>() 方 法 ， 虚 拟 机 会 自动 保证 父 类 构造 器 的 执行 ， 但 在 <<clinit>() 方 法 
中 经 常会 生成 调用 java.lang.Object 的 二 init> 0) 方法 的 代码 ) 等 操作 收敛 
到 <<init 之 0 和 < 委 clinit> (0 方法 之 中 ， 并 且 保 证 一 定 是 按 先 执行 父 类 的 实 
例 构造 器 ， 然 后 初始 化 变量 ， 最 后 执行 语句 块 的 顺序 进行 ， 上 面 所 述 的 
动作 由 Gen.normalizeDefs() 方 法 来 实现 。 除 了 生成 构造 器 以 外 ， 还 有 其 
他 的 一 些 代 码 替 换 工 作用 于 优化 程序 的 实现 逻辑 ， 如 把 字符 串 的 加 操作 
替换 为 StringBuffer 或 StringBuilder 〈 取 决 于 目标 代码 的 版 本 是 否 大 于 或 
等 于 JDK 1.5) 的 appendO 操 作 等 。 














完成 了 对 语法 树 的 过 历 和 调整 之 后 ， 束 会 把 填充 了 所 有 上 所 需 信 息 的 
符号 表 交 给 com.sun.tools.javac.jvm.ClassWriter 类 ， 由 这 个 类 的 
writeClass() 方 法 输出 字 节 人 码 ， 生 成 最 终 的 Class 文 件 ， 到 此 为 止 整个 编译 


过 程 宣告 结束 。 


10.3 Java 语法 糖 的 味道 


几乎 各 种 语言 或 多 或 少 都 提供 过 一 些 语法 糖 来 方便 程序 员 的 代码 开 
发 ， 这 些 语 法 糖 虽然 不 会 提供 实质 性 的 功能 改进 ， 但 是 它们 或 能 提高 效 
率 ， 或 能 提升 语法 的 严谨 性 ， 或 能 减少 编码 出 错 的 机 会 。 不 过 也 有 一 种 
观点 认为 语法 糖 并 不 一 定 都 是 有 益 的 ， 大 量 添加 和 使 用 “ 含 糖 ?的 语法 ， 
容易 让 程序 员 产 生 依赖 ， 无 法 看 清 语 法 糖 的 糖衣 背后 ， 程 序 代码 的 真实 
面目 。 


总 而 言 之 ， 语 法 糖 可 以 看 做 是 编译 器 实现 的 一 些 "小 把 戏 "， 这 
些小 把 戏 " 可 能 会 使 得 效率 “大 提升 "， 但 我 们 也 应 该 去 了 解 这 些小 把 
戏 "背后 的 真实 世界 ， 那 样 才能 利用 好 它们 ， 而 不 是 被 它们 所 迷惑. 


10.3.1 泛 型 与 类 型 擦 除 


泛 型 是 JDK 1.5 的 一 项 新 增 特性 ， 它 的 本 质 是 参数 化 类 型 
(Parametersized Type) 的 应 用 ， 也 就 是 说 所 操作 的 数据 类 型 被 指定 为 
一 个 参数 。 这 种 参数 类 型 可 以 用 在 类 、 接 口 和 方法 的 创建 中 ， 分 别称 为 


泛 型 类 、 泛 型 接口 和 泛 型 方法 。 


泛 型 思想 早 在 C++ 语言 的 模板 〈Template) 中 就 开始 生根 发 菠 ， 在 
Java 语 言 处 于 还 没有 出 现 泛 型 的 版 本 时 ， 只 能 通过 Object 是 所 有 类 型 的 


父 类 和 类 型 强制 转换 两 个 特点 的 配合 来 实现 类 型 泛 化 。 例 如 ， 在 哈 希 表 
的 存 取 中 ，JDK 1.5 之 前 使 用 HashMap 的 get() 方 法 ， 返 回 值 就 是 一 个 
Object 对 象 ， 由 于 Java 语 言 里 面 所 有 的 类 型 都 继承 于 java.lang.Object， 所 
以 Object 转型 成 任何 对 象 都 是 有 可 能 的 。 但 是 也 因为 有 无 限 的 可 能 性 ， 
就 只 有 程序 员 和 运行 期 的 虚拟 机 才 知 道 这 个 Object 到 底 是 个 什么 类 型 的 
对 象 。 在 编译 期 间 ， 编 译 器 无 法 检查 这 个 Object 的 强制 转型 是 否 成 功 ， 
如 果 仅 仅 依赖 程序 员 去 保障 这 项 操作 的 正确 性 ， 许 多 ClassCastEXception 
的 风险 就 会 转 媒 到 程序 运行 期 之 中 。 





泛 型 技术 在 C# 和 Java 之 中 的 使 用 方式 看 似 相同 ， 但 实现 上 却 有 着 根 
本 性 的 分 歧 ，C# 里 面 泛 型 无 论 在 程序 源码 中 、 编 译 后 的 十 中 
(Intermediate Language， 中 间 语 言 ， 这 时 候 泛 型 是 一 个 占 位 符 ) ， 或 
是 运行 期 的 CLR 中 ， 都 是 切实 存在 的 ，List<int> 与 List< String 之 就 是 
两 个 不 同 的 类 型 ， 它 们 在 系统 运行 期 生成 ， 有 自己 的 虚 方 法 表 和 类 型 数 
据 ， 这 种 实现 称 为 类 型 膨胀 ， 基 于 这 种 方法 实现 的 泛 型 称 为 真实 泛 型 。 





Java 语 言 中 的 泛 型 则 不 一 样 ， 它 只 在 程序 源码 中 存在 ， 在 编译 后 的 
字 节 码 文件 中 ， 就 已 经 蔡 换 为 原来 的 原生 类 型 〈Raw Type， 也 称 为 裸 类 
型 ) 了 ， 并 且 在 相应 的 地 方 插 入 了 强制 转型 代码 ， 因 此 ， 对 于 运行 期 的 
Java 语 言 来 说 ，ArrayList<int> 与 ArrayList< String> 之 就 是 同一 个 类 ， 所 
以 泛 型 技术 实际 上 是 Java 语 言 的 一 颗 语 法 糖 ，Java 语 言 中 的 泛 型 实现 方 
法 称 为 类 型 擦 除 ， 基 于 这 种 方法 实现 的 泛 型 称 为 伪 泛 型 。 














代码 清单 10-2 是 一 段 简单 的 Java 泛 型 的 例子 ， 我 们 可 以 看 一 下 它 编 
译 后 的 结果 是 怎样 的 。 


代码 清单 10-2 ” 泛 型 控 除 前 的 例子 





public static void main (String[]args) 1 
Map=Sstring,String~>map=new HashMap<=String,Sstring> (); 
map.put ("hello",“" 你 好") ， 

map.put ("how are you?"，" 吃 了 没 ?") ; 

System.out .println (map.get ("hello") ) ; 

System.out .println (map.get ("how are you?") ) ; 


} 


























把 这 段 Java 代 码 编译 成 Class 文 件 ， 然 后 再 用 字 市 码 反 编译 工具 进行 
肥 编 详 后 ， 将 会 发 现 沁 型 都 不 见 了 ， 程 序 又 变 回 了 Java 汉 型 出 现 之 前 的 
写法 ， 泛 型 类 型 都 变 回 了 原生 类 型 ， 如 代码 清单 10-3 所 示 。 





代码 清单 10-3 泛 型 擦 除 后 的 例子 








public static void main (String[]args) 1 

Map map=new HashMap () ; 

map.put ("hello", "你 好 ") ; 

map.put ("how are you?"，" 吃 了 没 ?") ; 

System.out .println ( (String) map.get ("hello") ) ; 
System.out .println ( (String) map.get ("how are you?") ) ; 


} 


























当初 JDK 设 计 团队 为 什么 选择 类 型 擦 除 的 方式 来 实现 Java 语 言 的 泛 
型 文 持 呢 ? 是 因为 实现 简单 、 兼 容 性 考虑 还 是 别 的 原因 ? 我 们 已 不 得 而 
知 ， 但 确实 有 不 少 人 对 Java 语 言 提 供 的 伪 泛 型 央 有 微 词 ， 当 时 甚至 连 








《Thinking in Java》 一 书 的 作者 Bruce Eckel 也 发 表 了 一 篇 文章 《这 不 是 
泛 型 ! 》 吕 来 批评 JDK 1.5 中 的 泛 型 实现 。 


在 当时 众多 的 批评 之 中 ， 有 一 些 是 比较 表面 的 ， 还 有 一 些 从 性 能 上 
说 泛 型 会 由 于 强制 转型 操作 和 运行 期 缺少 针对 类 型 的 优化 等 从 而 导致 比 
C# 的 泛 型 慢 一 些 ， 则 是 完全 偏离 了 方向 ， 姑 且 不 论 Java 泛 型 是 不 是 真 的 
会 比 C# 泛 型 慢 ， 选 择 从 性 能 的 角度 上 评价 用 于 提升 语义 准确 性 的 泛 型 思 
想 就 不 太 恰 当 。 但 笔者 也 并 非 在 为 Java 的 泛 型 辩护 ， 它 在 某 些 场景 下 确 
实 存在 不 足 ， 笔 者 认为 通过 探 除法 来 实现 泛 型 丧失 了 一 些 汉 型 思想 应 有 
的 优雅 ， 例 如 代码 清单 10-4 的 例子 。 











代码 清单 10-4” 当 泛 型 遇见 重 载 1 





public class GenericTypest 

public static void method (List<string>1ist) { 

System.out .println ("invoke method (List<SsString>1ist) ") ; 
} 
public static void method (List<Integer>1ist) { 

System.out .println ("invoke method (List<Integer>1ist) ") ; 
} 

} 




















请 想 一 想 ， 上 面 这 上 段 代 码 是 否 正 确 ， 能 否 编译 执行 ? 也 许 你 已 经 有 
了 答案 ， 这 上 段 代 码 是 不 能 被 编译 的 ， 因 为 参数 List 二 Integer> 和 List 一 
String 二 编译 之 后 都 被 探 除 了 ， 变 成 了 一 样 的 原生 类 型 List<E 二 >， 擦 除 
动作 导致 这 两 种 方法 的 特征 签名 变 得 一 模 一 样 。 初 步 看 来 ， 无 法 重 载 的 
原因 已 经 找到 了 ， 但 真 的 就 是 如 此 吗 ? 只 能 说 ， 泛 型 擦 除 成 相同 的 原生 





I 只 是 无 法 重 载 的 其 中 一 部 分 原因 ， 请 再 接着 看 一 看 代码 清单 10-5 中 
的 内 容 。 





代码 清单 10-5” 当 泛 型 遇见 重 载 2 





public class GenericTypest 

public static String method (List<string>1ist) 1 
System.out.println ("invoke method (List<Sstring>1ist) ") ; 
return""; 

} 

public static int method (List<Integer>1ist) 1 
System.out.println ("invoke method (List<Integer>1ist) ") ; 
return 1; 

} 

public static void main (String[]args) 1 

method (new ArrayList<string> ()); 
method (new ArrayList<Integer>()); 
} 

} 
































执行 结果 : 





invoke method (List<string>1ist) 
invoke method (List<Integer>1ist) 




















代码 清单 10-5 与 代码 清单 10-4 的 差别 是 两 个 method 方 法 添加 了 不 同 
的 返回 值 ， 由 于 这 两 个 返回 值 的 加 入 ， 方 法 重 载 居 然 成 功 了 ， 即 这 段 代 
人 码 可 以 被 编译 和 执行 了。 这 是 对 Java 语 言 中 返回 值 不 参与 重 载 选择 的 
基本 认 知 的 挑战 吗 ? 








代码 清单 10-5 中 的 重 载 当然 不 是 根据 返回 值 来 确定 的 ， 之 所 以 这 
能 编译 和 执行 成 功 ， 是 因为 两 个 method() 方 法 加 入 了 不 同 的 返回 值 后 才 


能 共存 在 一 个 Class 文 件 之 中 。 第 6 章 介绍 Class 文 件 方法 表 
(method_info〉 的 数据 结构 时 曾经 提 到 过 ， 方 法 重 载 要 求 方法 具备 不 同 
的 特征 签名 ， 返 回 值 并 不 包含 在 方法 的 特征 签名 之 中 ， 所 以 返回 值 不 参 
与 重 载 选择 ， 但 是 在 Class 文 件 格式 之 中 ， 只 要 描述 符 不 是 完全 一 致 的 两 
个 方法 就 可 以 共存 。 也 就 是 说 ， 两 个 方法 如 果 有 相同 的 名 称 和 特征 签 
名 ， 但 返回 值 不 同 ， 那 它们 也 是 可 以 合法 地 共存 于 一 个 Class 文 件 中 的 。 








由 于 Java 泛 型 的 引入 ， 各 种 场景 〈 虚 拟 机 解析 、 反 射 等 ) 下 的 方法 
调用 都 可 能 对 原 有 的 基础 产生 影响 和 新 的 需求 ， 如 在 泛 型 类 中 如 何 获取 
传 入 的 参数 化 类 型 等 。 因 此 ，JCP 组 织 对 虚拟 机 规范 做 出 了 相应 的 修 
改 ， 引 入 了 诸如 Signature、LocalVariableTypeTable 等 新 的 属性 用 于 解决 
伴随 泛 型 而 来 的 参数 类 型 的 识别 问题 ，Signature 是 其 中 最 重要 的 一 项 属 
性 ， 它 的 作用 就 是 存储 一 个 方法 在 字 节 码 层面 的 特征 签名 司 ， 这 个 属性 
中 保存 的 参数 类 型 并 不 是 原生 类 型 ， 而 是 包括 了 参数 化 类 型 的 信息 。 修 
改 后 的 虚拟 机 规范 四 要 求 所 有 能 识别 49.0 以 上 版 本 的 Class 文 件 的 虚拟 机 
都 要 能 正确 地 识别 Signature 参 数 。 











从 上 面 的 例子 可 以 看 到 探 除 法 对 实际 编码 带 来 的 影响 ， 由 于 List<< 
String> 和 List<Integer 之 擦 除 后 是 同一 个 类 型 ， 我 们 只 能 添加 两 个 并 不 
需要 实际 使 用 到 的 返回 值 才能 完成 重 载 ， 这 是 一 种 毫 无 优雅 和 美感 可 言 
的 解决 方案 ， 并 且 存 在 一 定语 意 上 的 混乱 ， 璧 如 上 面 脚 注 中 提 到 的 ， 必 
须 用 Sun JDK 1.6 的 Javac 才 能 编译 成 功 ， 其 他 版 本 或 者 ECJ 编 译 堪 都 可 能 





拒绝 编译 。 


另外 ， 从 Signature 属 性 的 出 现 我 们 还 可 以 得 出 结论 ， 探 除法 所 谓 的 
探 除 ， 仪 仅 是 对 方法 的 Code 属 性 中 的 字 市 码 进行 探 除 ， 实 际 上 元 数据 中 
还 是 保留 了 泛 型 信息 ， 这 也 是 我 们 能 通过 反射 手段 取得 参数 化 类 型 的 根 
本 依据 。 


[1 原文 地 址 : http://www.anyang-window.com.cn/quotthis-is-not-a- 
genericquot-bruce-eckel-eyes-of-the-generic-java/ 。 

上 测试 的 时 候 请 使 用 Sun JDK 1.6 的 Javac 编 译 器 进行 编译 ， 其 他 编译 器 ， 
如 Eclipse JDT 的 ECJ 编 译 器 ， 仍 然 可 能 会 拒绝 编译 这 段 代 码 ，ECJ 编 译 时 
会 提示 "Method method (List<String>) has the same erasure method (List 
<E>) asanother method in type GenericTypes"。 

[3] 在 《Java 虚 拟 机 规范 (第 2 版 ) 》 (JDK 1.5 修 改 后 的 版 本 ) 的 " § 4.4.4 
Signatutes" 章 节 及 《Java 语 言 规范 (第 3 版 ) 》 的 " § 8.4.2 Method 
Signature" 章 节 中 分 别 定义 了 字 节 码 层 面 的 方法 特征 签名 ， 以 及 Java 代 码 
层面 的 方法 特征 签名 ， 特 征 签 名 最 重要 的 任务 就 是 作为 方法 独一无二 且 
不 可 重复 的 ID ， 在 Java 代 码 中 的 方法 特征 签名 只 包括 了 方法 名 称 、 参 数 
顺序 及 参数 类 型 ， 而 在 字 节 码 中 的 特征 签名 还 包括 方法 返回 值 及 受 查 异 
常 表 ， 本 书 中 如 果 指 的 是 字 节 码 层 面 的 方法 签名 ， 笔 者 会 加 入 限定 语 进 
行 说 明 ， 也 请 读者 根据 上 下 文 语 境 注意 区 分 。 


[4]JDK 1.5 对 虚拟 机 规范 修改 : 


http://jcp.org/aboutJava/communityprocess/maintenance/jst 


924/index.html。 


10.3.2 ”自动 装 箱 、 拆 箱 与 遍历 循环 


从 纯 技 术 的 角度 来 讲 ， 自 动 装 箱 、 自 动 拆 箱 与 遍历 循环 (Foreach 
循环 ) 这些 语法 糖 ， 无 论 是 实现 上 还 是 思想 上 都 不 能 和 上 文 介绍 的 泛 型 
相 比 ， 两 者 的 难度 和 深度 都 有 很 大 差距 。 专 门 拿 出 一 节 来 讲解 它们 只 有 
一 个 理由 : 毫 无 疑问 ， 它 们 是 Java 语 言 里 使 用 得 最 多 的 语法 糖 。 我 们 通 
过 代码 清单 10-6 和 代码 清单 10-7 中 所 示 的 代码 来 看 看 这 些 语 法 糖 在 编译 
后 会 发 生 什么 样 的 变化 。 

















代码 清单 10-6 目 动 装 箱 、 拆 箱 与 过 历 循 环 








public static void main (String[]args) 1 
List<Integer>1ist=Arrays.asList (1, 2, 3, 4); 





// 如 果 在 JDK 1.7 中 ， 还 有 另外 一 颗 语法 糖 
// 能 让 上 面 这 名 代码 进 


int sum=0; 








sum+=1i; 


} 








= 


1 








for (int i:list) { 


System.out.println (sum) ; 


} 





步 简写 成 List 二 Integer>>list=[1,， 2，3,， 4]; 





代码 清单 10-7 ”自动 装 箱 、 拆 箱 与 遍历 循环 编译 之 后 





public static void main (String[]args) 1 





List list=Arrays.asList (new 








Integer.val 


ueoOf 


(1), 





Integer.val 


ueoOf 





Integer.val 


ueoOf 











Integer.val 


ueoOf 











int sum=0; 


(273 
《3) ， 
(4) } ) ; 





Integer[]t{ 

















for (Iterator LocalIterator=1ist.iterator(); 

















localIterator .hasNext(); ) { 
int i= ( (Integer) localIterator.next()) .intValue (); 
Sum+=1i; 


} 
System.out.println (sum) ; 


} 





代码 清单 10-6 中 一 共 包含 了 泛 型 、 自 动 装 箱 、 自 动 拆 箱 、 遍 历 循 环 
与 变 长 参数 5 种 语法 糖 ， 代 码 清 单 10-7 则 展示 了 它们 在 编译 后 的 变化 。 
泛 型 就 不 必 说 了 ， 自 动 装 箱 、 拆 箱 在 编译 之 后 被 转化 成 了 对 应 的 包装 和 
还 原 方法 ， 如 本 例 中 的 Integer.valueOfO 与 Integer.intValue() 方 法 ， 而 遍历 
循环 则 把 代码 还 原 成 了 迭代 器 的 实现 ， 这 也 是 为 何 遍历 循环 需要 被 遍历 
的 类 实现 Iterable 接 口 的 原因 。 最 后 再 看 看 变 长 参数 ， 它 在 调用 的 时 候 变 
成 了 一 个 数组 类 型 的 参数 ， 在 变 长 参数 出 现 之 前 ， 程 序 员 就 是 使 用 数组 
来 完成 类 似 功 能 的 。 























这 些 语 法 糖 虽然 看 起 来 很 简单 ， 但 也 不 见得 就 没有 任何 值得 我 们 注 
意 的 地 方 ， 代 码 清单 10-8 演 示 了 目 动 装 箱 的 一 些 错误 用 法 。 


代码 清单 10-8 自动 装 箱 的 陷阱 








public static void main (String[]args) 1 
Integer a=1; 

Integer b=2; 
Integer c=3; 
Integer d 
Integer e 
TInteger 二 
Long 9g=3L; 
System.out.println (c==d); 
System.out.println (e==fE) ; 















































System.out .println (c== (a+b) ) ; 
System.out .println (c.equals (a+b) ) ; 
System.out .println (g== (a+b) ) ; 
System.out .println (g.equals (a+b) ) ; 








阅读 完 代码 清单 10-8， 读 者 不 妨 思 考 两 个 问题 : 一 是 这 6 名 打印 语 
句 的 输出 是 什么 ? 二 是 这 6 名 打印 语句 中 ， 解 除 语法 糖 后 参数 会 是 什么 
样子 ? 这 两 个 问题 的 答案 可 以 很 容易 试验 出 来 ， 笔 者 就 暂且 略 去 答案 ， 
希望 读者 自己 上 机 实践 一 下 。 无 论 读者 的 回答 是 否 正确 ， 鉴 于 包装 类 
的 “==” 运 算 在 不 过 到 算术 运算 的 情况 下 不 会 自动 拆 箱 ， 以 及 它们 
equals() 方 法 不 处 理 数据 转型 的 关系 ， 笔 者 建议 在 实际 编码 中 尽量 避免 
这 样 使 用 自动 装 箱 与 拆 箱 




















[1 在 本 章 完稿 之 后 ， 此 语法 糖 随 着 Project Coin 一 起 被 划分 到 JDK 1.8 中 
了 ， 在 JDK 1.7 里 不 会 包括 。 


10.3.3 条件 编译 


许多 程序 设计 语言 都 提供 了 条 件 编译 的 途径 ， 如 C、C++ 中 使 用 预 
处 理 占 指示 符 ( 检 fdef〉 来 完成 条 件 编译 。C、C++ 的 预 处 理 避 最 初 的 任 
务 是 解决 编译 时 的 代码 依赖 关系 (如 非常 常用 的 ##nclude 预 处 理 命 
令 ) ， 而 在 Java 语 言 之 中 并 没有 使 用 预 处 理 器 ， 因 为 Java 语 言 天 然 的 编 
译 方式 (编译 器 并 非 一 个 个 地 编译 Java 文 件 ， 而 是 将 所 有 编译 单元 的 语 
法 树 顶级 节点 输入 到 待 处 理 列表 后 再 进行 编译 ， 因 此 各 个 文件 之 间 能 够 
互相 提供 符号 信息 ) 无须 使 用 预 处 理 器 。 那 Java 语 言 是 否 有 办 法 实现 条 
件 编译 呢 ? 











Java 语 言 当然 也 可 以 进行 条 件 编译 ， 方 法 就 是 使 用 条 件 为 常量 的 让 
语句 。 如 代码 清单 10-9 所 示 ， 此 代码 中 的 站 语句 不 同 于 其 他 Java 代 码 ， 
它 在 编译 阶段 就 会 被 < 运行 ”， 生 成 的 字 节 码 之 中 只 包 
括 "System.out.printlIn 〈"block 1") ; "一 条 语句 ， 并 不 会 包含 计 语 句 及 另 


外 一 个 分 子 中 的 "System.out.println ("block 2") ; " 





代码 清单 10-9 ”Java 语 言 的 条 件 编译 





public static void main (String[]args) 1 
if (true) { 

System.out.println ("block 1") ; 

}elsef 
System.out.println ("block 2") ; 


} 
































上 述 代码 编译 后 Class 文 件 的 反 编 译 结果 : 





public static void main (String[]args) 1 
System.out .println ("block 1") ; 
} 











只 能 使 用 条 件 为 常量 的 证 语句 才 能 达到 上 述 效 末 ， 如 果 使 用 常量 点 
其 他 带 有 条 件 判断 能 力 的 语句 搭配 ， 则 可 能 在 控制 流 分 析 中 提示 错误 ， 
被 拒绝 编译 ， 如 代码 清单 10-10 所 示 的 代码 束 会 被 编译 右 拒 绝 编译 。 


代码 清单 10-10 不 能 使 用 其 他 条 件 语句 来 完成 条 件 编译 








public static void main (String[]args) 1 
/ /编译 器 将 会 提示 "Unreachable code" 

while (false) { 

System.out .Println ("") ; 

} 

} 


























Java 语 言 中 条 件 编译 的 实现 ， 也 是 Java 语 言 的 一 里 语法 糖 ， 根 据 布 
尔 闸 量 值 的 真 假 ， 编 详 占 将 会 把 分 文中 不 成 立 的 代码 块 消除 挥 ， 这 一 工 
作 将 在 编译 器 解除 语法 糖 阶 段 (com.sun.tools.javac.comp.Lower 类 中 ) 
完成 。 由 于 这 种 条 件 编 译 的 实现 方式 使 用 了 让 语句 ， 所 以 它 必 须 遵循 最 
基本 的 Java 语 法 ， 只 能 写 在 方法 体内 部 ， 因 此 它 只 能 实现 语句 基本 块 
(Block) 级 别 的 条 件 编译 ， 而 没有 办 法 实现 根据 条 件 调整 整个 Java 类 的 
结构 。 





除了 本 节 中 介绍 的 泛 型 、 目 动 装 箱 、 目 动 拆 箱 、 明 历 循环 、 变 长 参 
数 和 条 件 编译 之 外 ，Java 语 言 还 有 不 少 其 他 的 语法 糖 ， 如 内 部 类 、 枚 举 
类 、 断 言语 多、 对 枚 举 和 字符 串 《〈 在 JDK 1.7 中 支持) 的 switch 支 持 、try 
语句 中 定义 和 关闭 资源 (在 JDK 1.7 中 支持 ) 等， 读者 可 以 通过 跟踪 
Javac 源 码 、 反 编译 Class 文 件 等 方式 了 解 它 们 的 本 质 实现 ， 关 于 篇 幅 ， 
笔者 束 不 再 一 一 介绍 了 。 





10.4 实战 : 插入 式 注 解 处 理 需 


JDK 编 译 优化 部 分 在 本 书 中 并 没有 设置 独立 的 实战 章节 ， 因 为 我 们 
开 友 程序 ， 考 虑 的 主要 是 程序 会 如 何 运 行 ， 很 少 会 有 针对 程序 编译 的 需 
求 。 也 因为 这 个 原因 ， 在 JDK 的 编译 子 系统 里 面 ， 提 供给 用 户 直 接 控制 
的 功能 相对 较 少 ， 除 了 第 11 章 会 介绍 的 虚拟 机 JIT 编 译 的 几 个 相关 参数 
以 外 ， 我 们 就 只 有 使 用 JSR-296 中 定义 的 插入 陈 注解 处 理 器 API 来 对 JDK 
编译 子 系统 的 行为 产生 一 些 影响 。 








但 是 笔者 并 不 认为 相对 于 前 两 部 分 介绍 的 内 存 管理 子 系统 和 字 节 码 
执行 子 系统 ，JDK 的 编译 子 系统 就 不 那么 重要 。 一 套 编程 语言 中 编译 子 
系统 的 优 劣 ， 很 大 程度 上 决定 了 程序 运行 性 能 的 好 坏 和 编码 效率 的 高 
低 ， 尤 其 在 Java 语 言 中 ， 运 行 期 即时 编译 与 虚拟 机 执行 子 系统 非常 紧密 
地 互相 依赖 、 配 合 运作 (第 11 章 将 主要 讲解 这 方面 的 内 容 ) 。 了 解 JDK 
如 何 编译 和 优化 代码 ， 有 助 于 我 们 写 出 适合 JDK 自 优化 的 程序 。 下 面 我 
们 回 到 本 章 的 实战 中 ， 看 看 插入 式 注解 处 理 器 API 能 实现 什么 功能 。 








10.4.1 ”实战 目标 


通过 阅读 Javac 编 译 器 的 源码 ， 我 们 知道 编译 器 在 把 Java 程 序 源码 编 
译 为 字 节 码 的 时 候 ， 会 对 Java 程 序 源码 做 各 方面 的 检查 校 验 。 这 些 校 验 











主要 以 程序 “ 写 得 对 不 对 ”为 出 发 点 ， 虽 然 也 有 各 种 WARNING 的 信息 ， 
但 总 体 来 讲 还 是 较 少 去 校 验 程序 “ 写 得 好 不 好 ”。 有 和 鉴于 此 ， 业 界 出 现 了 
许多 针对 程序 “ 写 得 好 不 好 ”的 辅助 校 验 工具 ， 如 CheckStyle、FindBug、 
Klocwork 等 。 这 些 代 码 校 验 工 具有 一 些 是 基于 Java 的 源码 进行 校 验 ， 还 
有 一 些 是 通过 扫描 字 节 码 来 完成 ， 在 本 节 的 实战 中 ， 我 们 将 会 使 用 注解 
处 理 孝 API 来 编写 一 区 拥有 目 己 编码 风格 的 校 验 工具 : 


NameCheckProcessor。 




















当然 ， 由 于 我 们 的 实战 都 是 为 了 学 习 和 演示 技术 原理 ， 而 不 是 为 了 
做 出 一 款 能 妮 美 CheckStyle 等 工具 的 产品 来 ， 所 以 NameCheckProcessor 
的 目标 也 仅 定 为 对 Java 程 序 命名 进行 检查 ， 根 据 《Java 语 言 规范 《第 3 
版 ) 》 中 第 6.8 贡 的 要 求 ，Java 程 序 命名 应 当 符 合 下 列 格式 的 书写 规范 。 








类 (或 接口 ) : 符合 驼 式 命名 法 ， 首 字母 大 写 。 


方法 : 符合 驼 式 命 名 法 ， 首 字母 小 写 。 





e 类 或 实例 变量 ; 符合 驼 式 命名 法 ， 首 字母 小 写 。 


e 常 量 : 要 求全 部 由 大 写字 母 或 下 划 线 构成 ， 并 且 第 一 个 字符 不 能 
是 下 划 线 。 


上 文 提 到 的 驼 式 命名 法 (Camel Case Name) ， 正 如 它 的 名 称 所 表 


示 的 那样 ， 是 指 混合 使 用 大 小 写字 母 来 分 割 构成 变量 或 函数 的 名 字 ， 狂 
如 怠 峰 一 般 ， 这 是 当前 Java 语 言 中 主流 的 命名 规范 ， 我 们 的 实战 目标 就 
古 为 Javac 编 译 圳 添加 一 个 额外 的 功能 ， 在 编 详 程序 时 检查 程序 名 是 个 
符合 上 述 对 类 〈 或 接口 ) 、 方 法 、 字 段 的 命名 要 求 趾 。 





[1 在 JDK 的 sample/javac/processing 目 录 中 有 这 次 实战 的 源码 (稍微 复杂 
一 些 , 但 总 体 上 差距 不 大 ) ， 读 者 可 以 阅读 参考 。 


10.4.2 ”代码 实现 


要 通过 注解 处 理 器 API 实 现 一 个 编译 器 插件 ， 首 先 需要 了 解 这 组 
API 的 一 些 基 本 知识 。 我 们 实现 注解 处 理 器 的 代码 需要 继承 抽象 类 
javax.annotation.processing.AbstractProcessor， 这 个 抽象 类 中 只 有 一 个 必 
须 履 盖 的 abstract 方 法 : "process()"， 它 是 Javac 编 译 器 在 执行 注解 处 理 器 
代码 时 要 调用 的 过 程 ， 我 们 可 以 从 这 个 方法 的 第 一 个 参 
数 "annotations" 中 获取 到 此 注解 处 理 器 所 要 处 理 的 注解 集合 ， 从 第 二 个 
参数 "roundEnv" 中 访问 到 当前 这 个 Round 中 的 语法 树 节点 ， 每 个 语法 树 
节点 在 这 里 表示 为 一 个 Element。 在 JDK 1.6 新 增 的 javax.lang.model 包 中 
定义 了 16 类 Element， 包 括 了 Java 代 码 中 最 常用 的 元 素 ， 如 :“ 包 

(PACKAGE) 、 枚 举 (ENUM) 、 类 (CLASS) 、 注 解 
CANNOTATION_TYPE) 、 接 口 CINTERFACE) 、 枚 举 值 
(ENUM_CONSTANT) 、 字 段 (FIELD) 、 参 数 (PARAMETER) 、 
本 地 变量 (LOCAL_ VARIABLE) 、 异 常 
(EXCEPTION_PARAMETER) 、 方 法 (METHOD) 、 构 造 函数 
(CONSTRUCTOR) 、 静 态 语 句 块 〈STATIC_INIT， 即 static{} 块 ) 、 
实例 语句 块 (INSTANCE_INIT， 即 {} 块 )、 参 数 化 类 型 
CTYPE_PARAMETER， 既 泛 型 僚 括 号 内 的 类 型 ) 和 未 定义 的 其 他 语法 
树 节点 (OTHER ) ”。 除 了 process() 方 法 的 传 入 参数 之 外 ， 还 有 一 个 很 








常用 的 实例 变量 "processingEnv"， 它 是 AbstractProcessor 中 的 一 个 
protected 变 量 ， 在 注解 处 理 器 初始 化 的 时 候 (init0 方 法 执行 的 时 候 》 创 
建 ， 继 承 了 AbstractProcessor 的 注解 处 理 器 代码 可 以 直接 访问 到 它 。 它 
代表 了 注解 处 理 器 框架 提供 的 一 个 上 下 文 环境 ， 要 创建 新 的 代码 、 向 编 


译 器 输出 信息 、 获 取 其 他 工具 类 等 都 需要 用 到 这 个 实例 变量 。 

















注解 处 理 器 除了 process() 方 法 及 其 参数 之 外 ， 还 有 两 个 可 以 配合 使 
用 的 Annotations:@SupportedAnnotationTypes 和 
@SupportedSourceVersion， 前 者 代表 了 这 个 注解 处 理 嚣 对 哪些 注解 感 兴 
趣 ， 可 以 使 用 星 号 “*” 作 为 通配符 代表 对 所 有 的 注解 都 感 兴 趣 ， 后 者 指 
出 这 个 注解 处 理 器 可 以 处 理 哪些 版 本 的 Java 代 码 。 


每 一 个 注解 处 理 器 在 运行 的 时 候 都 是 单 例 的 ， 如 果 不 需要 改变 或 生 
成 语法 树 的 内 容 ，process(0) 方 法 就 可 以 返回 一 个 值 为 false 的 布尔 值 ， 通 
知 编译 器 这 个 Round 中 的 代码 未 发 生变 化 ， 无 须 构 造 新 的 JavaCompiler 
实例 ， 在 这 次 实战 的 注解 处 理 器 中 只 对 程序 命名 进行 检查 ， 不 需要 改变 
语法 树 的 内 容 ， 因 此 process() 方 法 的 返回 值 都 是 false。 关 于 注解 处 理 器 
的 API， 笔 者 就 简单 介绍 这 些 ， 对 这 个 领域 有 兴趣 的 读者 可 以 阅读 相关 
的 帮助 文档 。 下 面 来 看 看 注解 处 理 器 NameCheckProcessor 的 具体 代码 ， 
如 代码 清单 10-11 所 示 。 











代码 清单 10-11 注解 处 理 器 NameCheckProcessor 


// 可 以 用 "*" 表 示 文 持 所 有 Annotations 


@Support 





tedAnnotationTypes ("*") 


// 只 支持 JDK 1.6 的 Java 代 码 








@Support 











tedSourceVersion (SourceVersion.RELEASE 6) 





public class NameCheckProcessor extends AbstractProcessor{ 





privat 


/** 


NameChecker nameChecker:; 


* 初 始 化 名 称 检查 插件 


六 





QOverride 
public void init (ProcessingEnvironment processingEnv) { 














super.init (processingEnv) ; 








nameChecker=new NameChecker (processingEnv); 


} 
/** 


* 对 输入 的 语法 树 的 各 个 节点 进行 名 称 检查 


2 





























QOverride 
public boolean process (Set<?extends TypeElement> 
annotations,RoundEnvironment roundEnv) 1 




















if (!roundEnv.processingOver ()) 1 











for (El] 








ment element:roundEnv.getRootElements () ) 








nameChecker.checkNames (element).; 





} 
return 
} 
} 





false; 





从 上 面 代码 可 以 看 出 ，NameCheckProcessor 能 处 理 基 于 JDK 1.6 的 源 





码 ， 它 不 限于 特定 的 注解 ， 对 任何 代码 都 “ 感 兴趣 ”， 而 在 process() 方 法 
中 是 把 当前 Round 中 的 每 一 个 RootElement 传 递 到 一 个 名 为 NameChecker 
的 检查 器 中 执行 名 称 检查 逻辑 ，NameChecker 的 代码 如 代码 清单 10-12 所 


钞 。 


代码 清单 10-12 命名 检查 器 NameChecker 





/** 





* 程 序 名 称 规范 的 编译 器 插件 :过 br>> 


>{ 


* 如 条 程序 命名 不 合 规范 ， 将 会 输出 


4 








public class NameChecKker{ 
private final Messager messag 
NameCheckScanner nameCheckScanner=new NameCheckScanner () ; 


NameChecker (Processing] 
this.messager=processsingl 


} 
/** 








个 编译 器 的 WAR 





























工 ; 





* 对 Java 程 序 命 名 进行 检查 ， 根 据 《Java 语 言 规范 ( 
序 命名 应 当 符合 下 列 格式 : 








x* 二 ul 请 
*<11i1> 之 类 或 接口 : 符合 驼 式 命名 法 ， 首 字母 大 写 。 
*<11> 方 法 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 
x< 1 之 字段 : 
x* 二 ul 请 
i 类、 实例 变量 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 


太 过 ] 
大 二 |] 

















i 常量 : 要 求全 部 大 写 。 











*</ul> 
*</ul> 


*/ 


public void checkNames (I 











Element element 


nameCheckScanner.scan (element).; 


} 
/** 


* 名 称 检查 器 实现 类 ， 继 承 了 JDK 1 .6 中 新 提供 的 





* 将 会 以 Visitor 模 式 访问 抽象 语法 树 中 的 元 素 

















private class NameCheckScanner extends 
/** 

* 此 方法 用 于 检查 Java 类 

#1 

QOverride 

public Void visitType (TypeEl 





NING 信 息 








Environment processsingEnv) { 
Env.getMessager (); 


第 3 版 ) 》 第 6.8 节 的 要 求 ，Java 程 





) { 


FlementScanner6=br> 





ElementScanner6=<=Void,Void 


ment e,Void p) { 








scan (e.getTypeParameters(), p); 
checkCamelCase (evrtrue) ; 
super.visitType (e,p); 
return null; 











} 
/** 





* 检 查 方 法 命名 是 否 合 法 


< 














QOverride 


pub 





Nam 





lic Void visitExecutable (] 





if (e.getKind()==METHOD) { 








name=e .getSimpleName (); 





Executablel 





Rlement e,Void p) { 





人 下 下 











(name.contentEquals (e.getEnclosingElement () .getSimpleName ()) ) 





messager.printMessage (WARNI 








避免 与 构造 函数 产生 混淆 "，e) ; 
checkCamelCase (efalse) ; 


} 








可 
up 


[NG, "一 个 普通 方法 " "+name+n "不 应 当 与 类 名 习 

















super.visitExecutable (e,p); 


return null:; 


} 


























/** 

* 检 查 变量 命名 是 否 合法 
*/ 

QOverride 








public Void visitVariable (VariableElement e,Void p) { 


// 如 果 这 个 variable 是 枚 举 或 常量 








checkAllCaps (e) ; 
else 
checkCamelCase (efalse) ; 
return nul1; 

} 

/** 

* 判 断 一 个 变量 是 否 是 常量 


4 




















四 








， 则 按 大 写 命名 检查 ， 否 则 按照 驼 式 命名 法 规则 检查 

















if (e.getKind()==ENUM CONSTANT| |e. ne 


private boolean heuristicallyConstant (VariableElement e) { 


















































if (e.getEnclosingElement () .getKind()==INTERFACE) 
return true:; 
lse if (e.getKind()==FIELD®& & 
e.getModifiers() .containsAll (EnumSet.of (PUBLIC,STATIC,FINAL) ) ) 


e) ; 
































return true:; 
elsel 
return false; 
} 

} 

/** 























* 检 查 传 入 的 Element 是 否 符 合 驼 式 命名 法 ， 如 果 不 符合 ， 则 输出 警告 信息 











*/ 


private void checkCamelCas 








(Element e,boolean initialCaps) { 








String name=e.getSimpleName () .toString(); 
boolean previousUpper=false:; 








boolean conventional=true; 





int firstCodePoint=name.codePointAt (0) ; 


if (Character.isUpperCase ( 
previousUpper=true:; 
if (!initialCaps) { 











messager.printMessage (WARNING 


return; 


firstCodePoint) ) { 











"名 称 ""+name+"" 应 当 以 小 写字 母 开 头 "， 


}else if (Character.isLowerCase (firstCodePoint) ) { 
if (initialCaps) { 
messager.printMessage (WARNING, "名 称 ""+name+" "应 当 以 大 写字 母 开头 "， 
e) ; 
fetUrn 
} 
}else 
conventional=false; 
if (conventional) 1 
int cp=firstCodePoint:; 
for (int i=Character.charCount (cp) ; i<name.length (); 
i+=Character.charCount (cp) ) { 
cp=name .codePointAt (i).; 
if (Character.isUpperCase (cp) ) { 
if (previousUpper) { 
conventional=false:; 
break:; 
} 
previousUpper=true:; 
}else 
previousUpper=false; 
} 
} 


if (!conventional) 






























































messager.printMessage (WARNING, "名 称 ""+name+" "应当 符合 弦 式 命名 法 
(Camel Case Names) "，e) : 

} 

/** 











* 大 写 命名 检查 ， 要 求 第 一 个 字母 必须 是 大 写 的 英文 字母 ， 其 余部 分 可 以 是 下 划 线 或 大 写字 


*/ 
private void checkAllCaps (Element e) { 
String name=e.getSimpleName () .toString () ; 
boolean conventional=true:; 
int firstCodePoint=name.codePointAt (0) ; 
if (I!Character.isUpperCase (firstCodePoint) ) 
conventional=false:; 
elselt 
boolean previousUnderscore=false:; 
int cp=firstCodePoint; 
for (int i=Character.charCount (cp) ; i<name.length (); 
i+=Character.charCount (cp) ) { 
cp=name .codePointAt (i).; 
if (cp== (int)" ') { 
if (previousUnderscore) { 
conventional=false:; 
break:; 












































} 
previousUnderscore=true; 
}elsel{ 
previousUnderscore=false; 
if (!Character.isUpperCase (cp) &&!ICcharacter.isDigit (cp) ) 

{ 

conventional=false; 

breark; 

} 

} 

} 

} 

if (!conventional) 

messager.printMessage (WARNING, " 常 
线 命名 ， 并 且 以 字母 开头 "，e) ; 

} 

} 

} 




















"应 当 全 部 以 大 写字 母 或 下 划 





wl 
Dy 











NameChecker 的 代码 看 起 来 有 点 长 ， 但 实际 上 注释 占 了 很 大 一 部 
分 ， 其 实 即 使 算 上 注释 也 不 到 190 行 。 它 通过 一 个 继承 于 
javax.lang.model.util.ElementScanner6 的 NameCheckScanner 类 ， 以 Visitor 
模式 来 完成 对 语法 树 的 过 历 ， 分 别 执行 visitTypeO0、visitVariable0 和 
visitExecutable() 方 法 来 访问 类 、 字 段 和 方法 ， 这 3 个 visit 方 法 对 各 自 的 命 
名 规则 做 相应 的 检查 ，checkCamelCase() 与 checkAllCaps() 方 法 则 用 于 实 
现 驼 式 命名 法 和 全 大 写 命名 规则 的 检查 。 





整个 注解 处 理 器 只 需 NameCheckProcessor 和 NameChecker 两 个 类 就 
可 以 全 部 完成 ， 为 了 验证 我 们 的 实战 成 果 ， 代 码 清单 10-13 中 提供 了 一 
段 命名 规范 的 “反面 教材 ”代码 ， 其 中 的 每 一 个 类 、 方 法 及 字段 的 命名 都 
存在 问题 ， 但 是 使 用 普通 的 Javac 编 译 这 段 代 码 时 不 会 提示 任何 一 个 


Warning 信 息 。 


代码 清单 10-13 包含 了 多 处 不 规范 命名 的 代码 样 例 


a 








public class BADLY NAMED COD] 
enum colorst 

red,blue,green; 

} 

static final int FORTY TWO=42; 

public static int NOT A CONSTANT= FORTY TWO; 
protected void BADLY NAMED CODE(){ 

return:; 








Ll 
一 一 





























public void NOTcamelCASEmethodNAME () { 
return; 


} 
} 


ee | 





10.4.3 ”运行 与 测试 





我 们 可 以 通过 Javac 命 令 的 "-processor" 参 数 来 执行 编译 时 需要 附带 的 
注解 处 理 器 ， 如 果 有 多 个 注解 处 理 器 的 话 ， 用 逗号 分 阳 。 还 可 以 使 用 - 
XprintRounds 和 -XprintProcessorInfo 参 数 来 查看 注解 处 理 器 运作 的 详细 信 
息 ， 本 次 实战 中 的 NameCheckProcessor 的 编译 及 执行 过 程 如 代码 清单 10- 
14 所 示 。 








代码 清单 10-14 ”注解 处 理 器 的 运行 过 程 











D: \src>javac org/fenixsoft/compile/NameChecker.java 
D: \src>javac org/fenixsoft/compile/NameCheckProcessor.java 
D: \src>javac-processor org.fenixsoft.compile.NameCheckProcessor 
org/fenixsoft/compile/BADLY NAMED CODE.java 
org\fenixsoft\compile\BADLY NAMED CODE .java:3: 和 警告 :名 
称 "BADLY _ NAMED CODE" 应 当 符 合 驼 式 命名 法 (Camel Case Names ) 
public class BADLY NAMED CODE{ 


人 




























































































殿 








告 : 名 称 "colors" 应 当 








org\fenixsoft\compile\BADLY NAMED CODE.java:5: 
以 大 写字 母 开头 

enum colorst 

org\fenixsoft\compile\BADLY NAMED CODE.java:6: 和 警告 :常量 "red" 应 当 全 部 
以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 

redqybluergtreeni 


人 









































org\fenixsoft\compile\BADLY NAMED CODE .java:6: 和 警告 :常量 "blue" 应 当 全 
部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 
red,blue,green:; 


os 




















沼 "_E.W 


org\fenixsoft\compile\BADLY NAMED CODE .java:6: 和 警告 :常量 "green" 应 当 全 
部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 
red,blue,green; 


人 


























于 








org\fenixsoft\compile\BADLY NAMED CODE .java:9: 和 警告 : 














-于 .W 


量 " FORTY 了 T 


static 


办 





Fina 





org\ 








fenixsof 








WO" 应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 
1 int FORTY TWO=42; 


ft \compile\l 





BADLY NAM 








称 "NOT A _CONSTANT" 应 当 以 小 写字 母 开头 





























ED CODE .java:11: 和 警告 :名 
public static int NOT A CONSTANT= FORTY TWO; 
org\fenixsoft\compile\BADLY NAMED COD] 
小 写字 母 开头 
protected void Test () { 
org\fenixso 
称 "NOTcame1lCAS] 


ft \compi 





le\BADLY NAM 
EmethodNAM 
public void NOTcame!] 











FP .java:13: 和 警告: 名称"Test" 应 当 以 

















_ NAMED CODE 
"应 当 以 小 写字 母 开 头 
CASEmethodNAM 


7 :警告 :名 
EE (){ 











10.4.4 ”其 他 应 用 案例 


NameCheckProcessor 的 实战 例子 只 演示 了 JSR-269 崩 入 式 注解 处 理 
器 API 中 的 一 部 分 功能 ， 基 于 这 组 API 支 持 的 项 目 还 有 用 于 校 验 Hibernate 
标签 使 用 正确 性 的 Hibernate Validator Annotation Processorll1〈 本 质 上 与 
NameCheckProcessor 所 做 的 事情 差不多 ) 、 自 动 为 字段 生成 getter 和 
setter 方 法 的 Project Lombok!” (根据 已 有 元 素 生 成 新 的 语法 树 元 素 ) 
等 ， 读 者 有 兴趣 的 话 可 以 参考 它们 官方 站 点 的 相关 内 容 。 














[1 官方 站 点 : http://www.hibernate.org/subprojects/validatotr.html。 


加 官方 站 点 : http://projectlombok.org/。 


10.5 本章 小 结 


在 本 章 中 ， 我 们 从 编译 器 源码 实现 的 层次 上 了 解 了 Java 源 代码 编译 
为 字 节 码 的 过 程 ， 分 析 了 Java 语 言 中 沁 型 、 主 动 装 箱 / 拆 箱 、 条 件 编译 等 
多 种 语法 糖 的 前 因 后 果 ， 并 实战 练习 了 如 何 使 用 插入 式 注解 处 理 占 来 完 
成 一 个 检查 程序 命名 规范 的 编 详 器 插件 。 如 本 章 概 述 中 所 说 的 那样 ， 在 
前 端 编 译 龙 中 ,，“ 优 化 ”手段 主要 用 于 提升 程序 的 编码 效率 ， 之 所 以 把 
Javac 这 类 将 Java 代 人 码 转变 为 字 节 人 码 的 编译 如 称 做 “前 端 编 详 此 *?”， 是 因为 
它 只 完成 了 从 程序 到 抽象 语法 树 或 中 间 字 节 码 的 生成 ， 而 在 此 之 后 ， 还 
有 一 组 内 置 于 虚拟 机 内 部 的 “后 端 编译 占 ” 完 成 了 从 字 市 码 生 成 本 地 机 器 
码 的 过 程 ， 即 前 面 多 次 提 到 的 即时 编译 器 或 JIT 编 译 器 ， 这 个 编译 器 的 
编译 速度 及 编译 结果 的 优 劣 ， 是 衡量 虚拟 机 性 能 一 个 很 重要 的 指标 。 在 
第 11 章 中 ， 我 们 将 会 介绍 即时 编译 器 的 运作 和 优化 过 程 。 





第 11 章 ”晚期 (运行 期 ) 优化 





从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 退 求 就 是 程序 天 生 的 坚定 
信仰 ， 这 个 过 程 犹 如 一 场 没有 终点 、 永 不 停 敬 的 F1 方 程式 竞赛 ,程序 员 
是 车 手 ， 技 术 平 台 则 是 在 赛 道上 飞驰 的 赛车 。 





11.1 概述 


在 部 分 的 商用 虚拟 机 (Sun HotSpot、IBM J9) 中 ，Java 程 序 最 初 是 
通过 解释 器 〈Interpreter) 进行 解释 执行 的 ， 当 虚拟 机 发 现 某 个 方法 或 
代码 块 的 运行 特别 频繁 时 ， 就 会 把 这 些 代码 认定 为 “热点 代码 ”(Hot 
Spot Code) 。 为 了 提高 热点 代码 的 执行 效率 ， 在 运行 时 ， 虚 拟 机 将 会 把 
这 些 代码 编译 成 与 本 地 平台 相关 的 机 器 码 ， 并 进行 各 种 层次 的 优化 ， 完 
成 这 个 任务 的 编译 器 称 为 即时 编译 器 (Just In Time Compiler， 下 文中 简 
称 JIT 编 译 器 〉。 








即时 编译 器 并 不 是 虚拟 机 必需 的 部 分 ，Java 虚 拟 机 规范 并 没有 规定 
Java 虚 拟 机 内 必须 要 有 即时 编译 占 存 在 ， 更 没有 限定 或 指导 即时 编译 此 
应 该 如 何 去 实 现 。 但 是 ， 即 时 编译 喜 编 译 性 能 的 好 坏 、 代 码 优化 程度 的 
局 低 却 是 衡量 一 球 商 用 虚拟 机 优秀 与 否 的 最 关键 的 指标 之 一 ， 它 也 是 虚 
拟 机 中 最 核心 且 最 能 体现 虚拟 机 技术 水 平 的 部 分 。 在 本 半 中 ， 我 们 将 走 





进 虚拟 机 的 内 部 ， 探 索 即时 编译 器 的 运作 过 程 。 


由 于 Java 虚 拟 机 规范 没有 有 具体 的 约束 规则 去 限制 即时 编译 需 应 该 如 
何 实现 ， 所 以 这 部 分 功能 完全 是 与 虚拟 机 具体 实现 〈Implementation 
Specific) 相关 的 内 容 ， 如 无 特殊 说 明 ， 本 章 提 及 的 编译 器 、 即 时 编译 
需 都 是 指 HotSpot 虚 拟 机 内 的 即时 编 详 恬 ， 虚 拟 机 也 是 特 指 HotSpot 虚 拟 
机 。 不 过 ， 本 章 的 大 部 分 内 容 是 描述 即时 编译 器 的 行为 ， 涉 及 编译 器 实 
现 层面 的 内 容 较 少 ， 而 主流 虚拟 机 中 即时 编译 右 的 行为 又 有 很 多 相似 和 
相通 之 处 ， 因 此 ， 对 其 他 虚拟 机 来 说 也 具有 较 高 的 参考 意义 。 














11.2 ”HotSpot 虚 拟 机 内 的 即时 编译 需 


在 本 节 中 ， 我 们 将 要 了 解 HotSpot 虚 拟 机 内 的 即时 编译 器 的 运作 过 
程 ， 同 时 ， 还 要 解决 以 下 几 个 问题 : 


为 何 HotSpot 虚 拟 机 要 使 用 解释 器 与 编译 器 并 存 的 架构 ? 





为 何 HotSpot 虚 拟 机 要 实现 两 个 不 同 的 即时 编译 器 ? 
程序 何 时 使 用 解释 器 执行 ? 何 时 使 用 编译 器 执行 ? 
哪些 程序 代码 会 被 编译 为 本 地 代码 ? 如 何 编译 为 本 地 代码 ? 


如 何 从 外 部 观察 即时 编译 器 的 编译 过 程 和 编译 结果? 


11.2.1 解释 器 与 编译 器 





尽管 并 不 是 所 有 的 Java 虚 拟 机 都 采用 解释 喜与 编译 器 并 存 的 淋 构 ， 
但 许多 主流 的 商用 虚拟 机 ， 如 HotSpot、J9 等 ， 都 同时 包含 解释 器 与 编 
译 器 趾 。 解 释 器 与 编译 器 两 者 各 有 优势 ， 当 程 序 需要 迅速 启动 和 执行 的 
时 候 ， 解 释 器 可 以 首先 发 挥 作用 ， 省 去 编译 的 时 间 ， 立 即 执行 。 在 程序 
运行 后 ， 随 着 时 间 的 推移 ， 编 译 需 逐渐 发 挥 作用 ， 把 越 来 越 多 的 代码 编 
译 成 本 地 代码 之 后 ， 可 以 获取 更 高 的 执行 效率 。 当 程序 运行 环境 中 内 存 








资源 限制 较 大 如 部 分 葵 入 式 系统 中 ) ， 可 以 使 用 解释 执行 市 约 内 存 ， 
反之 可 以 使 用 编译 执行 来 提升 效率 。 同 时 ， 解 释 器 还 可 以 作为 编译 器 激 
进 优化 时 的 一 个 “逃生 门 ?， 让 编译 器 根据 概率 选择 一 些 大 多 数 时 候 都 能 
提升 运行 速度 的 优化 手段 ， 当 激进 优化 的 假设 不 成 立 ， 如 加 载 了 新 类 后 
类 型 继承 结构 出 现 变 化 、 出 现 “ 罕 见 陷阱 ”(Uncommon Trap ) 时 可 以 通 
过 逆 优 化 (Deoptimization) 退回 到 解释 状态 继续 执行 (部 分 没有 解释 
器 的 虚拟 机 中 也 会 采用 不 进行 激进 优化 的 C1 编 译 器 六 担任 “逃生 门 ” 的 角 
色 ) ， 因 此 ， 在 整个 虚拟 机 执行 架构 中 ， 解 释 器 与 编译 器 经 常 配合 工 
作 ， 如 图 11-1 所 示 。 





即时 编译 
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HotSpot 虚 拟 机 中 内 置 了 两 个 即时 编译 器 ， 分 别称 为 Client Compiler 
和 Server Compiler， 或 者 简称 为 C1 编译 器 和 C2 编译 器 (也 叫 Opto 编 译 
器 ) 。 目 前 主流 的 HotSpot 虚 拟 机 (Sun 系列 JDK 1.7 及 之 前 版 本 的 虚拟 








机 ) 中 ， 默 认 采 用 解释 器 与 其 中 一 个 编译 器 直接 配合 的 方式 工作 ， 程 序 
使 用 哪个 编译 器 ， 取 决 于 虚拟 机 运行 的 模式 ，HotSpot 虚 拟 机 会 根据 自 
号 版 本 与 宿主 机 器 的 硬件 性 能 自动 选择 运行 模式 ， 用 户 也 可 以 使 用 "- 
client" 或 "-server" 参 数 去 强制 指定 虚拟 机 运行 在 Client 模 式 或 Server 模 

RS 





无 论 采 用 的 编译 器 是 Client Compiler 还 是 Server Compiler， 解 释 器 与 
编译 器 搭配 使 用 的 方式 在 虚拟 机 中 称 为 “混合 模式 ”(Mixed Mode) ， 用 
户 可 以 使 用 参数 "-Xint" 强 制 虚拟 机 运行 于 “解释 模式 ”(Interpreted 
Mode) ， 这 时 编译 器 完全 不 介入 工作 ， 全 部 代码 都 使 用 解释 方式 执 
行 。 另 外 ， 也 可 以 使 用 参数 "-Xcomp" 强 制 虚拟 机 运行 于 “编译 模 
式 ”(Compiled Mode) 5 中， 这 时 将 优先 采用 编译 方式 执行 程序 ， 但 是 解 
释 器 仍然 要 在 编译 无 法 进行 的 情况 下 介入 执行 过 程 ， 可 以 通过 虚拟 机 
的 "-version" 命 令 的 输出 结果 显示 出 这 3 种 模式 ， 如 代码 清单 11-1 所 示 ， 


请 注意 黑体 字 部 分 。 


代码 清单 11-1 虚拟 机 执行 模式 





C:\>java-version 

java Version"1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 
19.0-b04-internal,mixed mode) 

C:\java-Xint-version 

java Version"1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 
19.0-b04-internal,interpreted mode) 



































C:\java-Xcomp-version 

java Version"1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 
19.0-b04-internal,compiled mode) 




















由 于 即时 编译 器 编译 本 地 代码 需要 占用 程序 运行 时 间 ， 要 编译 出 优 
化 程度 更 高 的 代码 ， 所 花费 的 时 间 可 能 更 长 ， 而 且 想 要 编译 出 优化 程度 
更 高 的 代码 ， 解 释 器 可 能 还 要 荐 编 译 器 收集 性 能 监控 信息 ， 这 对 解释 执 
行 的 速度 也 有 影响 。 为 了 在 程序 局 动 啊 应 速度 与 运行 效率 之 间 达 到 最 佳 
平衡 ，HotSpot 虚 拟 机 还 会 逐渐 启用 分 层 编译 〈Tiered Compilation〉 [的 
策略 ， 分 层 编 译 的 概念 在 JDK 1.6 时 期 出 现 ， 后 来 一 直 处 于 改进 阶段 ， 
最 终 在 JDK 1.7 的 Server 模 式 虚 拟 机 中 作为 默认 编译 策略 被 开启。 分 层 编 
译 根据 编译 器 编译 、 优 化 的 规模 与 耗 时 ， 划 分 出 不 同 的 编译 层次 ， 其 中 
包括 : 




















第 0 层 ， 程 序 解释 执行 ， 解 释 器 不 开启 性 能 监控 功能 (Profiling) ， 
可 触发 第 1 层 编译 。 

第 1 层 ， 也 称 为 C1 编 译 ， 将 字 节 人 码 编译 为 本 地 代码 ， 进 行 简单 、 可 
靠 的 优化 ， 如 有 必要 将 加 入 性 能 监控 的 逻辑 。 





第 2 层 〈 或 2? 层 以 上 ) ， 也 称 为 C2 编 译 ， 也 是 将 字 节 码 编 译 为 本 地 代 
码 ， 但 是 会 启用 一 些 编译 耗 时 较 长 的 优化 ， 甚 至 会 根据 性 能 监控 信息 进 
行 一 些 不 可 靠 的 激进 优化 。 


实施 分 层 编译 后 ，Client Compiler 和 Server Compiler 将 会 同时 工作 ， 





许多 代码 都 可 能 会 被 多 次 编译 ， 用 Client Compiler 获 取 更 高 的 编译 速 
度 ， 用 Server Compiler 来 获取 更 好 的 编译 质量 ， 在 解释 执行 的 时 候 也 无 
须 再 承担 收集 性 能 监控 信息 的 任务 。 


四 作为 三 大 商用 虚拟 机 之 一 的 JRockit 是 个 例外 ， 它 内 部 没有 解释 器 ， 因 
此 会 存在 本 书 中 所 说 的 “局 动 响应 时 间 长 ”之 类 的 缺点 ， 但 它 主 要 是 面 
向 服务 端的 应 用 ， 这 类 应 用 一 般 不 会 重点 关注 启动 时 间 。 

D] 在 虚拟 机 中 习惯 将 Client Compiler 称 为 C1， 将 Server Compiler 称 为 C2。 
[3] 在 最 新 的 Sun HotSpot 中 ， 已 经 去 掉 了 -Xcomp 参 数 。 

[4JTiered Compilation 的 概念 在 JDK 1.6 时 期 出 现 ， 但 JDK 1.7 之 前 需要 使 
用 -XX:+TieredCompilation 参 数 来 手动 开启 ， 如 果 不 开 局 分 层 编 译 策略 ， 
而 虚拟 机 又 运行 在 Server 模 式 ，Server Compiler 需 要 性 能 监控 信息 提供 纺 

译 依据 ， 则 可 以 由 解释 器 收集 性 能 监控 信息 供 Server Compiler 使 用 。 分 
层 编译 的 相关 资料 可 参见 : 


http:/ /weblogs.java.net/blog/forax/archive/2010/09/04/tiered-compilation。 


11.2.2 ”编译 对 象 与 触发 条 件 





上 文中 提 到 过 ， 在 运行 过 程 中 会 被 即时 编译 器 编译 的 “热点 代码 ”有 
两 类 ， 上 ]. 


被 多 次 调用 的 方法 。 

被 多 次 执行 的 循环 体 。 

前 者 很 好 理解 ， 一 个 方法 被 调用 得 多 了 ， 方 法 体内 代码 执行 的 次 数 
目 然 吏 多 ， 它 成 为 “ 热 反 代码 ”是 理所当然 的 。 而 后 者 则 是 为 了 解决 一 个 
方法 只 被 调用 过 一 次 或 少量 的 几 次 ， 但 是 方法 体内 部 存在 循环 次 数 较 多 
的 循环 体 的 问题 ， 这 样 循环 体 的 代码 也 被 重复 执行 多 次 ， 因 此 这 些 代码 
也 应 该 认为 是 “热点 代码 ”。 








对 于 第 一 种 情况 ， 由 于 是 由 方法 调用 触发 的 编译 ， 因 此 编译 器 理 所 
当然 地 会 以 整个 方法 作为 编译 对 象 ， 这 种 编译 也 是 虚拟 机 中 标准 的 JIT 
编译 方式 。 而 对 于 后 一 种 情况 ， 尽 管 编译 动作 是 由 循环 体 所 触发 的 ， 但 
编译 器 依然 会 以 整个 方法 《而 不 是 单独 的 循环 体 ) 作为 编译 对 象 。 这 种 
编译 方式 因为 编译 发 生 在 方法 执行 过 程 之 中 ， 因 此 形象 地 称 之 为 栈 上 蔡 
换 (On Stack Replacement， 简 称 为 OSR 编 译 ， 即 方法 栈 帧 还 在 栈 上 ， 方 
法 就 被 将 换 了 ) 。 








读者 可 能 还 会 有 疑问 ， 在 上 面 的 文字 描述 中 ， 无 论 是 “多 次 执行 的 
方法 ”， 还 是 “多 次 执行 的 代码 块 "”， 所 谓 “ 多 次 ”部 不 是 一 个 具体 、 严 谍 
的 用 语 ， 那 到 请 多 少 次 才 算 “多 次 ” 呢 ? 还 有 一 个 问题 ， 就 是 虚拟 机 如 何 
统计 一 个 方法 或 一 段 代 码 被 执行 过 多 少 次 昵 ?解决 了 这 两 个 问题 ， 也 就 
回答 了 即时 编译 被 触发 的 条 件 。 








判断 一 段 代 人 码 是 不 是 热点 代码 ， 是 不 是 需要 触发 即时 编译 ， 这 样 的 
行为 称 为 热点 探测 (Hot Spot Detection) ， 其 实 进 行 热 点 探测 并 不 一 定 
要 知道 方法 具体 被 调用 了 多 少 次 ， 目 前 主要 的 热点 探测 判定 方式 有 两 种 
站， 分 别 如 下 。 


基于 采样 的 热点 探测 (Sample Based Hot Spot Detection) : 采用 这 
种 方法 的 虚拟 机 会 周期 性 地 检查 各 个 线程 的 栈 项 ， 如 果 发 现 某 个 《或 某 
些 ) 方法 经 常 出 现在 栈 顶 ， 那 这 个 方法 就 是 “热点 方法 ”"。 基 于 采样 的 热 
点 探测 的 好 处 是 实现 简单 、 高 效 ， 还 可 以 很 容易 地 获取 方法 调用 关系 
《将 调用 堆栈 展开 即 可 ) ， 缺 点 是 很 难 精 确 地 确认 一 个 方法 的 热度 ， 容 
易 因为 受到 线程 阻塞 或 别 的 外 界 因素 的 影响 而 扰乱 热点 探测 。 














基于 计数 器 的 热点 探测 (Counter Based Hot Spot Detection ) : 采用 
这 种 方法 的 虚拟 机 会 为 每 个 方法 (甚至 是 代码 块 〉 建 立 计数 器 ， 统 计 方 
法 的 执行 次 数 ， 如 果 执 行 次 数 超过 一 定 的 闵 值 就 认为 它 是 “热点 方法 ”。 
这 种 统计 方法 实现 起 来 麻烦 一 些 ， 需 要 为 每 个 方法 建立 并 维护 计数 器 ， 
而 且 不 能 直接 获取 到 方法 的 调用 关系 ， 但 是 它 的 统计 结果 相对 来 说 更 加 








精确 和 严 主 。 


在 HotSpot 虚 拟 机 中 使 用 的 是 第 二 种 一 一 基于 计数 堪 的 热点 探测 方 
法 ， 因 此 它 为 每 个 方法 准备 了 两 类 计数 器 : 方法 调用 计数 器 
(Invocation Counter) 和 回 边 计数 器 〈Back Edge Counter) 。 


在 确定 虚拟 机 运行 参数 的 前 担 下 ， 这 两 个 计数 器 都 有 一 个 确定 的 国 
值 ， 当 计数 器 超过 阔 值 溢出 了 ， 就 会 触发 JIT 编 译 。 


我 们 首先 来 看 看 方法 调用 计数 器 。 顾 名 思 义 ， 这 个 计数 器 就 用 于 统 
计 方 法 被 调用 的 次 数 ， 它 的 默认 浆 值 在 Client 模 式 下 是 1500 次 ， 在 Server 
模式 下 是 10 000 次 ， 这 个 浆 值 可 以 通过 虚拟 机 参数 - 
XX:CompileThreshold 来 人 为 设 定 。 当 一 个 方法 被 调用 时 ， 会 先 检查 该 
方法 是 否 存 在 被 IT 编 译 过 的 版 本 ， 如 果 存 在 ， 则 优先 使 用 编译 后 的 本 
地 代码 来 执行 。 如 果 不 存在 已 被 编译 过 的 版 本 ， 则 将 此 方法 的 调用 计数 
器 值 加 1， 然 后 判断 方法 调用 计数 器 与 回 边 计数 器 值 之 和 是 否 超过 方法 
调用 计数 器 的 阔 值 。 如 果 已 超过 闭 值 ， 那 么 将 会 向 即时 编译 器 提交 一 个 
该 方法 的 代码 编译 请 求 。 








如 宁 不 做 任何 设置 ， 执 行 引擎 并 不 会 同步 等 竺 编 诺 请 求 完成 ， 而 是 
继续 进入 解释 器 按照 解释 方式 执行 字 市 码 ， 直 到 提交 的 请 求 被 编译 占 编 
译 完 成 。 当 编译 工作 完成 之 后 ， 这 个 方法 的 调用 入 口 地 址 残 会 被 系统 目 
动 改写 成 新 的 ， 下 一 次 调用 该 方法 时 就 会 使 用 已 编译 的 版 本 。 整 个 JIT 





编译 的 交互 过 程 如 图 11-2 所 示 。 


Java 方 法 入 口 


是 否 存在 已 编译 版 本 


执行 编译 后 的 本 地 代码 版 本 








rN 
区 


方法 调用 计数 器 值 加 1 









两 计数 器 值 之 和 
是 否 超过 国 值 


向 编译 融 提 交 编 译 请 求 
以 解释 方式 执行 方法 


Java 方 法 返回 






图 11-2 方法 调用 计数 器 触发 即时 编译 


如 果 不 做 任何 设置 ， 方 法 调用 计数 器 统计 的 并 不 是 方法 被 调用 的 绝 
对 次 数 ， 而 是 一 个 相对 的 执行 频率 ， 即 一 段 时 间 之 内 方法 被 调用 的 次 
数 。 当 超过 一 定 的 时 间 限 度 ， 如 果 方 法 的 调用 次 数 仍然 不 足以 让 它 提交 
给 即时 编译 器 编译 ， 那 这 个 方法 的 调用 计数 器 就 会 被 减少 一 半 ， 这 个 过 
程 称 为 方法 调用 计数 器 热度 的 衰减 〈Counter Decay) ， 而 这 段 时 间 就 称 
为 此 方法 统计 的 半 训 周期 (Counter Half Life Time) 。 进 行 热度 衰减 的 
动作 是 在 虚拟 机 进行 垃圾 收集 时 顺便 进行 的 ， 可 以 使 用 虚拟 机 参数 - 
XX:-UseCounterDecay 来 关闭 热 度 衰 减 ， 让 方法 计数 器 统计 方法 调用 的 
绝对 次 数 ， 这 样 ， 只 要 系统 运行 时 间 足 够 长 ， 绝 大 部 分 方法 都 会 被 编译 
成 本 地 代码 。 另 外 ， 可 以 使 用 -XX:CounterHalfLifeTime 参 数 设置 半 衰 周 
期 的 时 间 ， 单 位 是 秒 。 


现在 我 们 再 来 看 看 另外 一 个 计数 圳 一 一 回 边 计数 需 ， 生 的 作用 是 统 
计 一 个 方法 中 循环 体 代码 执行 的 次 数 趾 ， 在 字 节 码 中 过 到 控制 流向 后 跳 
转 的 指令 称 为 “ 回 边 ”(Back Edge) 。 显 然 ， 建 立 回 边 计 数 器 统计 的 目 
的 束 是 为 了 触及 OSR 编 译 。 


关于 回 边 计 数 器 的 阔 值 ， 虽 然 HotSpot 虚 拟 机 也 提供 了 一 个 类 似 于 
方法 调用 计数 器 闪 值 -XX:CompileThreshold 的 参数 - 
XX:BackEdgeThreshold 供 用 户 设 置 ， 但 是 当前 的 虚拟 机 实际 上 并 未 使 用 
此 参数 ， 因 此 我 们 需要 设置 另外 一 个 参数 -XXX:OnStackReplacePercentage 
来 间接 调整 回 边 计数 器 的 闵 值 ， 其 计算 公式 如 下 。 


虚拟 机 运行 在 Client 模 式 下 ， 回 边 计数 右 浆 值 计 算 公 式 为 : 
方法 调用 计数 器 浆 值 《CompileThreshold) xOSR 比 率 


(OnStackReplacePercentage) /100 


其 中 OnStackReplacePercentage 默 认 值 为 933， 如 果 都 取 默 认 值 ， 那 
Client 模 式 虚 拟 机 的 回 边 计数 器 的 阀 值 为 13995。 


虚拟 机 运行 在 Server 模 式 下 ， 回 边 计数 絮 闵 值 的 计算 公式 为 : 


方法 调用 计数 器 阔 值 (CompileThreshold) x (OSR 比 率 
COnStackReplacePercentage) -解释 器 监控 比率 


(CInterpreterProfilePercentage) /100 


其 中 OnStackReplacePercentage 默 认 值 为 140， 
InterpreterProfilePercentage 默 认 值 为 33， 如 果 都 取 默 认 值 ， 那 Server 模 式 
虚拟 机 回 边 计 数 器 的 阔 值 为 10700。 





当 解 释 嚣 遇 到 一 条 回 边 指令 时 ， 会 先 查 找 将 要 执行 的 代码 片段 是 否 
有 已 经 编译 好 的 版 本 ， 如 果 有 ， 它 将 会 优先 执行 已 编译 的 人 代码， 否则 束 
把 回 边 计 数 器 的 值 加 1， 然 后 判断 方法 调用 计数 需 与 回 边 计数 器 值 之 和 
古 否 超过 回 边 计数 器 的 阐 值 。 当 超过 立 值 的 时 候 ， 将 会 提交 一 个 OSR 编 
译 请 求 ， 并 且 把 回 边 计数 器 的 值 降低 一 些 ， 以 便 继续 在 解释 器 中 执行 循 
环 ， 等 竺 编译 器 输出 编译 结果 ， 整 个 执行 过 程 如 图 11-3 所 示 。 






遇 到 回 边 指令 


是 否 存在 已 编译 版 本 


否 是 
回 边 计数 需 值 加 1 执行 编译 后 的 本 地 代码 版 本 






两 计数 器 值 之 和 
是 否 超过 阔 值 


是 


向 编译 器 提交 OSR 编 译 请 求 
调整 回 边 计数 器 值 
以 解释 方式 继续 执行 


否 


Java 方 法 返回 





图 11-3 回 边 计数 器 触发 即时 编译 


与 方法 计数 器 不 同 ， 回 边 计 数 器 没有 计数 热度 衰减 的 过 程 ， 因 此 这 
个 计数 器 统计 的 就 是 该 方法 循环 执行 的 绝对 次 数 。 当 计数 需 洲 出 的 时 
候 ， 它 还 会 把 方法 计数 器 的 值 也 调整 到 洲 出 状态 ， 这 样 下 次 再 进入 该 方 
法 的 时 候 束 会 执行 标准 编译 过 程 。 


最 后 需要 提醒 一 点 ， 图 11-2 和 图 11-3 都 仅仅 描述 了 Client VM 的 即时 
编译 方式 ， 对 于 Server VM 来 说 ， 执 行情 况 会 比 上 面 的 描述 更 复杂 一 
些 。 从 理论 上 了 解 过 编译 对 象 和 编译 触发 条 件 后 ， 我 们 再 从 HotSpot 虚 
拟 机 的 源码 中 观察 一 下 ， 在 MethodOop.hpp〔 一 个 methodOop 对 象 代 表 
了 一 个 Java 方 法 ) 中 ， 定 义 了 Java 方 法 在 虚拟 机 中 的 内 存 布局 ， 如 下 所 


外: 











header 
klass 
constMethodOop {oop) 
constants {oop) 
methodData (cop) 


interp invocation count 
access flags | 
vtable index 


result index {C++ interpreter only) 


method size | max_ stack 

max _ locals | size of parameters 
intrinsic idl| flags | throwout count | 
num breakpoints | (unused) 


invocation counter 


backedge counter 


prev time {tiered only, 64 bit wide) 


rate (tiered) 


code (pointer) 
2 (pointer) 
adapter (pointer) 
from compiled entry (pointer) 
from interpreted entry (pointer) 
native function (present only if native) 
signature handler (present only if native) 





在 这 个 内 存 布局 中 ， 一 行 长 度 为 32 bit， 从 中 可 以 清楚 地 看 到 方法 
调用 计数 器 和 回 边 计数 器 所 在 的 位 置 和 长 度 。 还 有 from_compiled_entry 
和 from_interpreted_entry 这 两 个 方法 的 入 口 。 


[1] 除 这 两 种 方式 外 ， 还 有 其 他 热点 代码 的 探测 方式 ， 如 基于 “ 踪 
迹 ” (Trace) 的 热点 探测 在 最 近 相 当 流 行 ， 像 FireFox 中 的 TraceMonkey 
和 Dalvik 中 新 的 ]IT 编 译 器 都 用 了 这 种 热点 探测 方式 。 

准确 地 说 ， 应 当 是 回 边 的 次 数 而 不 是 循环 次 数 ， 因 为 并 非 所 有 的 循环 
都 是 回 边 ， 如 空 循 环 实际 上 就 可 以 视 为 自己 跳 转 到 自己 的 过 程 ， 因 此 并 


不 算 作 控制 流向 后 跳 转 ， 也 不 会 被 回 边 计 数 器 统计 。 


11.2.3 ”编译 过 程 


在 默认 设置 下， 无 论 是 方法 调用 产生 的 即时 编译 请 求 ， 还 是 OSR 编 
译 请求 ， 虚 拟 机 在 代码 编译 器 还 未 完成 之 前 ， 都 仍然 将 按照 解释 方式 继 
续 执行 ， 而 编译 动作 则 在 后 台 的 编译 线程 中 进行 。 用 户 可 以 通过 参数 - 
XX:-BackgroundCompilation 来 禁止 后 台 编 译 ， 在 禁止 后 台 编 译 后 ， 一 旦 
达到 JIT 的 编译 条 件 ， 执 行 线程 向 虚拟 机 提交 编译 请 求 后 将 会 一 直 等 
待 ， 直 到 编译 过 程 完成 后 再 开始 执行 编译 占 输 出 的 本 地 代码 。 











那么 在 后 台 执 行 编译 的 过 程 中 ， 编 译 寓 做 了 什么 事情 呢 ? Server 
Compiler 和 Client Compiler 两 个 编译 器 的 编译 过 程 是 不 一 样 的 。 对 于 
Client Compiler 来 说 ， 它 是 一 个 简单 快速 的 三 段 式 编译 器 ， 主 要 的 关注 
点 在 于 局 部 性 的 优化 ， 而 放弃 了 许多 耗 时 较 长 的 全 局 优化 手段 。 








在 第 一 个 阶段 ， 一 个 平台 独立 的 前 端 将 字 节 码 构造 成 一 种 高 级 中 间 
代码 表示 (High-Level Intermediate Representaion,HIR) 。HIR 使 用 静态 
单 分 配 (Static Single Assignment,SSA) 的 形式 来 代表 代码 值 ， 这 可 以 使 
得 一 些 在 HIR 的 构造 过 程 之 中 和 之 后 进行 的 优化 动作 更 容易 实现 。 在 此 
之 前 编译 器 会 在 字 节 码 上 完成 一 部 分 基础 优化 ， 如 方法 内 联 、 常 量 传播 
等 优化 将 会 在 字 节 码 被 构造 成 HIR 之 前 完成 








在 第 二 个 阶段 ， 一 个 平台 相关 的 后 并 从 HIR 中 产生 低级 中 间 代 码 表 


示 (Low-Level Intermediate Representation,LIR) ， 而 在 此 之 前 会 在 HIR 
上 完成 另外 一 些 优化 ， 如 空 值 检 碍 消除 、 范 围 检查 消除 等 ， 以 便 让 HIR 
达到 更 高 效 的 代码 表示 形式 。 


最 后 阶段 是 在 平台 相关 的 后 端 使 用 线性 扫描 算法 (Linear Scan 
Register Allocation ) 在 LIR 上 分 配 寄存 器 ， 并 在 LIR 上 做 宁 孔 
(Peephole)〉 优化， 然后 产生 机 器 代码 。Client Compiler 的 大 致 执行 过 程 
如 图 11-4 所 示 。 


字 节 码 HIR 到 LLR 转 换 


优化 后 的 HIR 寄存 器 分 配 
常量 传播 宕 孔 优 化 


范围 检查 消除 


HIR (SSA 形 式 ) 其 他 优化 本 地 代码 





前 端 后 端 
图 11-4 Client Compiler 架 构 
而 Server Compiler 则 是 专门 面 同 服 务 端的 典型 应 用 并 为 服务 端的 性 


能 配置 特别 调整 过 的 编译 器 ， 也 是 一 个 充分 优化 过 的 高 级 编译 器 ， 几 乎 
能 达到 GNU C++ 编 译 右 使 用 -O02 参数 时 的 优化 强度 ， 它 会 执行 所 有 经 典 


的 优化 动作 ， 如 无 用 代码 消除 (Dead Code Elimination) 、 循 环 展开 
(Loop Unrolling) 、 循 环 表 达 式 外 提 (Loop Expression Hoisting) 、 消 


除 公 共 子 表达 式 〈Common Subexpression Elimination〉、 常 量 传播 





《Constant Propagation ) 、 基 本 块 重 排序 (Basic Block Reordering ) 

等 ， 还 会 实施 一 些 与 Java 语 言 特性 密切 相关 的 优化 技术 ， 如 范围 检查 消 
除 (Range Check Elimination) 、 空 值 检 查 消 除 (Null Check 
Elimination， 不 过 并 非 所 有 的 空 值 检查 消除 都 是 依赖 编译 器 优化 的 ， 有 
一 些 是 在 代码 运行 过 程 中 自动 优化 了 ) 等 。 另 外 ， 还 可 能 根据 解释 器 或 
Client Compiler 提 供 的 性 能 监控 信息 ， 进 行 一 些 不 稳定 的 激进 优化 ， 如 
守护 内 联 (Guarded Inlining〉、 分 文 频率 预测 (Branch Frequency 
Prediction) 等 。 本 章 的 下 半 部 分 将 会 挑选 上 述 的 一 部 分 优化 手段 进行 分 
析 和 讲解 。 











Server Compiler 的 寄存 器 分 配器 是 一 个 全 局 图 着 色 分 配器 ， 它 可 以 
充分 利用 某 些 处 理 器 架构 〈 如 RISC) 上 的 大 寄存 器 集合 。 以 即时 编译 
的 标准 来 看 ，Server Compiler 无 颖 是 比较 缓慢 的 ， 但 它 的 编译 速度 依然 
远 远 超过 传统 的 静态 优化 编译 占 ， 而 且 它 相对 于 Client Compiler 编 译 输 
出 的 代码 质量 有 所 提高 ， 可 以 减少 本 地 代码 的 执行 时 间 ， 从 而 抵消 了 额 
外 的 编译 时 间 开 销 ， 所 以 也 有 很 多 非 服 务 端 的 应 用 选择 使 用 Server 模 式 
的 虚拟 机 运行 。 


在 本 市 中 ,涉及 了 许多 编译 原理 和 代码 优化 中 的 概念 名 词 ， 没 有 这 


方面 基础 的 读者 ， 阅 读 起 来 会 感觉 到 抽象 和 理论 化 。 有 这 种 感觉 并 不 奇 
怪 ，JII 纺 诺 过 程 本 来 就 是 一 个 虚拟 机 中 最 体现 技术 水 平 也 是 最 复杂 的 
部 分 ， 不 可 能 以 较 短 的 篇 幅 就 介绍 得 很 详细 ， 另 外 ， 这 个 过 程 对 Java 开 
发 来 说 是 透明 的 ， 程 序 员 平 时 无 法 感知 它 的 存在 ， 还 好 HotSpot 虚 拟 机 
提供 了 两 个 可 视 化 的 工具 ， 让 我 们 可 以 “看 见 ”JIT 编 译 费 的 优化 过 程 ， 
在 稍 后 笔者 将 演示 这 个 过 程 。 








11.2.4 ”查看 及 分 析 即 时 编译 结 


一 般 来 说 ， 虚 拟 机 的 即时 编译 过 程 对 用 户 程 序 是 完全 透明 的 ， 虚 拟 

机 通过 解释 执行 代码 还 是 编译 执行 代码 ， 对 于 用 户 来 说 并 没有 什么 影响 

(执行 结果 没有 影响 ， 速 度 上 会 有 很 大 差别 ) ， 在 大 多 数 情 况 下 用 户 也 

没有 必要 知道 。 但 是 虚拟 机 也 提供 了 一 些 参数 用 来 输出 即时 编译 和 茶 些 

优化 手段 “如 方法 内 联 》 的 执行 状况 ， 本 节 将 介绍 如 何 从 外 部 观察 虚拟 
机 的 即时 编译 行为 。 








本 节 中 提 到 的 运行 参数 有 一 部 分 需要 Debug 或 FastDebug 版 虚拟 机 的 
文 持 ，Product 版 的 虚拟 机 无 法 使 用 这 部 分 参数 。 如 果 读 者 使 用 的 是 根据 
本 书 第 1 章 的 内 容 自 己 编译 的 JDK， 注 意 将 SKIP_DEBUG_BUILD 或 
SKIP FASTDEBUG_BUILD 人 参数 设置 为 false， 也 可 以 在 OpenJDK 网 站 上 
直接 下 载 FastDebug 版 的 JDK (从 JDK 6u25 之 后 Oracle 官 网 就 不 再 提供 
FastDebug 的 JDK 下 载 了 ) 。 注 意 ， 本 节 中 所 有 的 测试 都 基于 代码 清单 
11-2 所 示 的 Java 人 代码。 


代码 清单 11-2 ”测试 代码 











public static final int NUM=15000; 
public static int doubleValue (int i) { 
// 这 个 空 循环 用 于 后 面 演示 JIT 代 码 优化 过 程 
for (int j=0; j<100000; j++); 
return i*2; 


} 
































public static long calcSum(){ 
long sum=0; 

for (int i=1; i<=100; i++) { 
sum+=doubleValue (I) ; 

} 

return sunm; 

} 

public static void main (String[]args) 1 
for (int i=0; i<NUM; i++) { 
calcSum(); 

} 

} 




















首先 运行 这 段 代码 ， 并 且 确 认 这 段 代 码 是 否 触 发 了 即时 编译 ， 要 知 
道 菜 个 方法 是 否 被 编译 过 ， 可 以 使 用 参数 -XX:+PrintCompilation 要 求 虚 
拟 机 在 即时 编译 时 将 被 编译 成 本 地 代码 的 方法 名 称 打印 出 来 ， 如 代码 清 
单 11-3 所 示 〈 其 中 带 有 “%” 的 输出 说 明 是 由 回 边 计数 絮 触 发 的 OSR 编 


评注 


代码 清单 11-3 ”被 即时 编译 的 代码 





VM option +PrintConmpilhation' 

310 1 java.lang.String:charAt (33 bytes) 

329 2 org.fenixsoft.jit.Test:calcSum (26 bytes) 
329 3 org.fenixsoft.jit.Test:doubleValue (4 bytes) 
332 1l%org.fenixsoft.jit.Test:main@5 (20 bytes) 









































从 代码 清单 11-3 输 出 的 确认 信息 中 可 以 确认 main0、calcSum0 和 
doubleValue() 方 法 已 经 被 编译 ， 我 们 还 可 以 加 上 参数 -XX:+PrintInlining 
要 求 虚 拟 机 输出 方法 内 联 信息 ， 如 代码 清单 11-4 所 示 。 


代码 清单 11-4 内 联 信息 


VM option'+PrintConmpilation’ 

VM option" +PrintInlining" 

273 1 java.lang.String:charAt (33 bytes) 

291 2 org.fenixsoft.jit.Test:calcSum (26 bytes) 

@9 org.fenixsoft.jit.Test:doubleValue inline (hot) 
294 3 org.fenixsoft.jit.Test:doubleValue (4 bytes) 
295 1l%org.fenixsoft.jit.Test:main@5 (20 bytes) 

@5 org.fenixsoft.jit.Test:calcSum inline (hot) 

@9 org.fenixsoft.jit.Test:doubleValue inline (hot) 































































































从 代码 清单 11-4 的 输出 中 可 以 看 到 方法 doubleValue() 被 内 联 编译 到 
calcSum0 中 ， 而 calcSum0 又 被 内 联 编译 到 方法 main0 中 ， 所 以 虚拟 机 再 
次 执行 main() 方 法 的 时 候 〈 举 例 而 已 ，main() 方 法 并 不 会 运行 两 次 ) ， 
calcSum() 和 doubleValue() 方 法 都 不 会 再 被 调用 ， 它 们 的 代码 逻辑 都 被 直 
接 内 联 到 main() 方 法 中 了 。 


除了 查看 哪些 方法 被 编译 之 外 ， 还 可 以 进一步 查看 即时 编译 器 生成 
的 机 器 码 内 容 ， 不 过 如 果 虚 拟 机 输出 一 串 0 和 1， 对 于 我 们 的 阅读 来 说 是 
没有 意义 的 ， 机 器 码 必 须 反 汇编 成 基本 的 汇编 语言 才 可 能 被 阅读 。 虚 拟 
机 提供 了 一 组 通用 的 反 汇编 接 口 山 ， 可 以 接 入 各 种 平台 下 的 反 汇 编 适 配 
峰 来 使 用 ， 如 使 用 32 位 80x86 平 台 则 选用 hsdis-i386 适 配 妖 ， 其 余 平台 的 
适配器 还 有 hsdis-amd64、hsdis-sparc 和 hsdis-sparcv9 等 ， 可 以 下 载 或 自己 
编译 出 反 汇 编 适 配器 号 ， 然 后 将 其 放置 在 JRE/bin/client 或 /server 目 录 
下 ， 只 要 与 jvm.dll 的 路 径 相同 即 可 被 虚拟 机 调用 。 在 为 虚拟 机 安装 了 反 
汇编 适配器 之 后 ， 就 可 以 使 用 -XX:+PrintAssembly 参 数 要 求 虚拟 机 打印 
编译 方法 的 汇编 代码 了 ， 具 体 的 操作 可 以 参考 本 书 4.2.7 节 。 








如 果 没 有 HSDIS 插 件 支 持 ， 也 可 以 使 用 - 
XX:+PrintOptoAssembly 《用 于 Server VM) 或 -XX:+PrintLIR 〈 用 于 
Client VM) 来 输出 比较 接近 最 终结 果 的 中 间 代 码 表示 ， 代 码 清 单 11-2 被 
编译 后 部 分 反 汇 编 〈 使 用 -XX:+PrintOptoAssembly) 的 输出 结果 如 代码 
清单 11-5 所 示 。 从 阅读 角度 来 说 ， 使 用 -XX:+PrintOptoAssembly 参 数 输 
出 的 伪 汇 编 结果 包含 了 更 多 的 信息 (主要 是 注释 ) ， 利 于 阅读 并 理解 虚 
拟 机 JIT 编 译 器 的 优化 结果 。 








代码 清单 11-5 ”本 地 机 器 人 码 反 汇编 信息 (部 分 ) 





000 Bl1:#N1=-BLOCK HEAD IS JUNK Freq:1 

000 Pushd rbp 

subq rsp, #16#Create frame 

nop#nop for patch verified entry 

006 movl RAX,RDX#spill 

008 sall RAX, #1 

00a addq rsp, 16#Destroy frame 

popq rbp 

testl rax, [ript+#offset to poll pagel#Safepoint:poll for GC 










































































前 面 提 到 的 使 用 -XX:+PrintAssembly 参 数 输出 反 汇 编 信息 需要 
Debug 或 者 FastDebug 版 的 虚拟 机 才能 直接 支持 ， 如 果 使 用 Product 版 的 虚 
拟 机 ， 则 需要 加 入 参数 -XX:+UnlockDiagnosticVMOptions 打 开 虚 拟 机 诊 
断 模式 后 才能 使 用 。 


如 果 除 了 本 地 代码 的 生成 结果 外 ， 还 想 再 进一步 跟 躁 本 地 代码 生成 


的 具体 过 程 ， 那 还 可 以 使 用 参数 -XX:+PrintCFGToFile (使 用 Client 

Compiler) 或 -XX:PrintIdealGraphFile (使 用 Server Compiler) 令 虚 拟 机 
将 编译 过 程 中 各 个 阶段 的 数据 例如， 对 Cl 编译 器 来 说 ， 包 括 字 节 码 、 
HIR 和 后 成、LIR 和 生成、 寄存器 分 配 过 程 、 本 地 代码 生成 等 数据 ) 输出 到 
文件 中 。 然 后 使 用 Java HotSpot Client Compiler Visualizer3l 〈 用 于 分 析 





Client Compiler) 或 Ideal Graph Visualizerl41 (用 于 分 析 Server Compiler) 
打开 这 些 数据 文件 进行 分 析 。 以 Server Compiler 为 例 ， 笔 者 分 析 一 下 JIT 
编译 器 的 代码 生成 过 程 。 





Server Compiler 的 中 间 代 码 表示 是 一 种 名 为 Ideal 的 SSA 形 式 程序 依 
赖 图 (Program Dependence Graph) ， 在 运行 Java 程 序 的 JVM 人 参数 中 加 
入 "-XX:PrintIdealGraphLevel=2-XX:PrintIdealGraphFile=ideal.xml"， 编 译 
后 将 产生 一 个 名 为 ideal.xml 的 文件 ， 它 包含 了 Server ee 译 代 码 
的 过 程 信息 ， 可 以 使 用 Ideal Graph Visualizer 对 这 些 信息 进行 分 析 。 


Ideal Graph Visualizer 加 载 ideal.xml 文 件 后 ， 在 Outline 面 板 上 将 显示 
程序 运行 过 程 中 编译 过 的 方法 列表 ， 如 图 11-5 所 示 。 这 里 列 出 的 方法 是 
代码 清单 11-2 中 的 测试 代码 ， 其 中 doubleValue() 方 法 出 现 了 两 次 ， 这 是 
由 于 该 方法 的 编译 结果 存在 标准 编译 和 OSR 编 译 两 个 版 本 。 在 代码 清单 
11-2 中 ， 笔 者 特别 为 doubleValue() 方 法 增加 了 一 个 空 循环 ， 这 个 循环 对 
方法 的 运算 结果 不 会 产生 影响 ， 但 如 果 没 有 任何 优化 ， 执 行 空 循 环 会 占 
用 CPU 时 间 ， 到 今天 还 有 许多 程序 设计 的 入 门 教程 把 空 循环 当做 程序 延 





时 的 手段 来 介绍 ， 在 Java 中 这 样 的 做 法 真 的 能 起 到 延 时 的 作用 吗 ? 


Outline 


V Receive when name contains | 


> virtual jchar java.lang. String.charAt(j int) 
vw 9 static jint org.fenixsoft.Test3.doubleValue(jint) 
已 ”After Parsing 
> lter CVN 1 
PhaseldealLoop 1 
PhaseCPP 1 
lter GVN 2 
起 Optimize finished 
~ Before Matching 
~ Global code motion 
Final Code 
| static jint org,.fenixsoft.Test3.doubleValue(jint) 
! static jlong org.fenixsoft.Test3.calcSum() 








图 11-5 编译 过 的 方法 列表 





展开 方法 根 贡 点， 可 以 看 到 下 面 罗列 了 方法 优化 过 程 的 各 个 阶段 

(根据 优化 措施 的 不 同 ， 每 个 方法 所 经 过 的 阶段 也 会 有 所 差别 〉 的 Ideal 
图 ， 我 们 先 打 开 "After Parsing" 这 个 阶段 。 上 文 提 有 到，JIT 编 译 费 在 编译 
一 个 Java 方 法 时 ， 痛 先 要 把 字 节 人 码 解 析 成 条 种 中 间 表 示 形 式 ， 然 后 才 可 
以 继续 做 分 析 和 优化 ， 最 终生 成 代码 。"After Parsing" 就 是 Server 

Compiler 刚 完成 解析 ， 还 没有 做 任何 优化 时 的 Ideal 图 表示 。 在 打开 这 个 
图 后 ， 读 者 会 看 到 其 中 有 很 多 有 颜色 的 方块 ， 如 图 11-6 所 示 。 每 一 个 方 
块 就 代表 了 一 个 程序 的 基本 块 (Basic Block) ， 基 本 块 的 特点 是 只 有 唯 


一 的 一 个 入 口 和 唯一 的 一 个 出 口 ， 只 要 基本 块 中 第 一 条 指令 执行 了 ， 那 
么 基本 英 内 所 有 执行 都 会 按照 顺序 仅 执行 一 次 。 


代码 清单 11-2 的 doubleValue() 方 法 虽然 只 有 简单 的 两 行 字 ， 但 是 按 
基本 块 划分 后 ， 形 成 的 图 形 结构 要 比 想象 中 复杂 得 多 ， 这 一 方面 是 要 满 
足 Java 语 言 所 定义 的 安全 需要 《如 类 型 安全 、 空 指针 检查 ) 和 Java 虚 拟 
机 的 运作 需要 (如 Safepoint 轮 询 ) ， 另 一 方面 是 由 于 有 些 程序 代码 中 一 
行 语句 就 可 能 形成 好 几 个 基本 块 《〈 例 如 循环 ) 。 对 于 例子 中 的 
doubleValue() 方 法 ， 如 果 忽 略语 言 安 全 检查 的 基本 块 ， 可 以 简单 理解 为 
按 顺序 执行 了 以 下 几 件 事情 : 

















1) 程序 入 口 ， 建 立 栈 帧 。 


2) 设置 j=0， 进 行 Safepoint 轮 询 ， 跳 转 到 4) 的 条 件 检查 。 


D4 


3) 执行 j++。 


D4 


4) 条 件 检查 ， 如 果 j 二 100000， 跳 转 到 3)。 


Wd 


5) 设置 i=i*2， 进 行 Safepoint 轮 询 ， 函 数 返 回 。 











After Parsing eroOWN1 PhaseCPP 1 Iter GVN 2 本 3 Final Code 








图 11-6 基本 块 图 示 (1) 


以 上 几 个 步骤 ， 反 映 到 Ideal Graph Visualizer 的 图 上 ， 就 是 如 图 11-7 
所 示 的 内 容 。 这 样 我 们 要 看 空 循 环 是 否 优 化 ， 或 者 何 时 优化 ， 只 要 观察 
代表 循环 的 基本 块 是 否 消 除 ， 或 者 何 时 消除 就 可 以 了 。 


要 观察 到 这 一 点 ， 可 以 在 Outline 面 板 上 右键 点 击 "Difference to 
current graph"， 让 软件 自动 分 析 指 定 阶 段 与 当前 打开 的 Ideal 图 之 间 的 差 


异 ， 如 果 基 本 块 被 消除 了 ， 将 会 以 红色 显示 。 对 "After 
Parsing" 和 "PhaseldealLoop 1" 阶 段 的 Ideal 图 进行 差异 分 析 ， 发 现 

在 "PhaseIdealLoop 1" 阶 段 循环 操作 被 消除 了 ， 如 图 11-8 所 示 ， 这 也 就 说 
明 空 循环 实际 上 是 不 会 被 执行 的 。 





图 11-7 基本 块 图 示 (2) 


> BB virtual jchar java.lang.String.charAt(jint) 
vv WD static jint org.fenixsoft.Test3.doubleValue(jint) 





» D static jint org.fenixsoft. Test3.doubleValue(jint) 
» static jlong org.fenixsoft.Test3.calcSum() 





图 11-8 基本 块 图 示 (3) 


从 "After Parsing" 阶 段 开始 ， 一 直到 最 后 的 "Final Code" 阶 段 ， 可 以 


看 到 doubleValue() 方 法 的 Ideal 图 从 党 到 简 的 变迁 过 程 ， 这 也 是 Java 虚 拟 
机 在 尽力 优化 代码 的 过 程 。 到 了 最 后 的 "Final Code" 阶 段 ， 不 仅 空 循环 
的 开销 消除 了 ， 许 多 语言 安全 和 Safepoint 轮 询 的 操作 也 一 起 消除 了 ， 
为 编译 器 判断 即使 不 做 这 些 安全 保障 ， 虚 拟 机 也 不 会 受到 威胁 。 


最 后 提醒 一 下 读者 ， 要 输出 CFG 或 IdealGraph 文 件 ， 需 要 一 个 Debug 
版 或 FastDebug 版 的 虚拟 机 支持 ，Product 版 的 虚拟 机 无 法 输出 这 些 文 
件 。 


http:/ /wikis.sun.com/display/ HotSpotInternals/PrintAssembly。 

[2JHSDIS 的 源码 可 以 从 以 下 地 址 获取 : 

http://hg.openjdk.java.net/jdk7/hotspot/hotspot/file/tip/src/share/tools/hsdi 

另外 ， 相 关 网 站 可 以 下 载 一 个 已 经 编译 好 了 的 适合 32 位 80x86 平 台 使 用 

的 反 汇 编 适 配器 ， 如 在 ITeye 的 高 级 语言 虚拟 机 圈子 的 共享 区 
(http://hllvm.group.iteye.com/group/share) 中 可 以 下 载 。 

D 官 方 站 点 : http://java.net/projects/clvisualizer/。 

困 官 方 站 点 : http://ssw.jku.at/General/Staff/TW /igv.html。 


11.3 编译 优化 技术 


Java 程 序 员 有 一 个 共识 ， 以 编译 方式 执行 本 地 代码 比 解释 方式 更 
快 ， 之 所 以 有 这 样 的 共识 ， 除 去 虚拟 机 解释 执行 字 节 码 时 额外 消耗 时 间 
的 原因 外 ， 还 有 一 个 很 重要 的 原因 就 是 虚拟 机 设计 团队 几乎 把 对 代码 的 
所 有 优化 措施 都 集中 在 了 即时 编译 器 之 中 在 JDK 1.3 之 后 ，Javac 就 去 
除了 -0O 选 项， 不 会 生成 任何 字 节 码 级 别 的 优化 代码 了 ) ， 因 此 一 般 来 
说 ， 即 时 编译 器 产生 的 本 地 代码 会 比 Javac 产 生 的 字 节 码 更 加 优秀 机 。 下 
面 ， 笔 者 将 介绍 一 些 HotSpot 虚 拟 机 的 即时 编译 器 在 生成 代码 时 采用 的 
代码 优化 技术 。 





11.3.1 优化 技术 概览 


在 Sun 官 方 的 Wiki 上 ，HotSpot 虚 拟 机 设计 团队 列 出 了 一 个 相对 比较 
全 面 的 、 在 即时 编译 器 中 采用 的 优化 技术 列表 号 〈 见 表 11-1) ， 其 中 有 
不 少 经 典 编译 器 的 优化 手段 ， 也 有 许多 针对 Java 语 言 (准确 地 说 是 针对 
运行 在 Java 虚 拟 机 上 的 所 有 语言 ) 本 号 进行 的 优化 技术 ， 本 节 将 对 这 些 
技术 进行 概括 性 的 介绍 ， 在 后 面 几 节 中 ， 再 挑选 右 干 重要 且 和 典型 的 优 
化 ， 与 读者 一 起 看 看 优化 前 后 的 代码 产生 了 怎样 的 变化 。 





编译 器 策略 


(compiler tactics) 


基于 性 能 监控 的 优化 技术 


(profile-based techniques) 


基于 证 据 的 优化 技术 


(proof-based techniques) 


表 11-1 


即时 编译 器 优化 技术 一 览 


优化 技术 
延迟 编译 (delayed compilation) 
分 层 编 详 (tiered compilation ) 
栈 上 替换 (on-stack replacement) 
延迟 优化 (delayed reoptimization) 
程序 依赖 图 表示 (program dependence graph representation ) 
静态 单 典 值 表示 (static single assignment representation ) 
乐观 空 值 断言 (optimistic nullness assertions) 
乐观 类 型 断言 (optimistic type assertions ) 
乐观 类 型 增强 (optimistic type strengthening ) 
乐观 数组 长 度 增强 (optimistic array length strengthening ) 
裁 前 未 被 选择 的 分 支 (untaken branch pruning ) 
乐观 的 多 态 内 联 (optimistic N-morphic inlining ) 
分 支 频率 预测 (branch frequency prediction) 
调用 频率 预测 (call frequency prediction ) 
精确 类 型 推断 (exacttype inference) 
内 存 值 推断 (memory value inference) 
内 存 值 跟踪 (memory value tracking) 
常量 折 共 (constant folding) 
重组 (reassociation) 
操作 符 退 化 (operator strength reduction) 
空 值 检查 消除 (null check elimination ) 
类 型 检测 退化 (type test strength reduction) 
类 型 检测 消除 (type test elimination ) 
代数 化 简 (algebraic simplification) 
公共 子 表达 式 消除 (common subexpression elimination) 


类 型 优化 技术 
条 件 常 其 传 播 (conditional constant propagation ) 
基于 流 承 载 的 类 型 缩减 转换 (flow-carried type narrowing ) 
无 用 代码 消除 (dead code elimination ) 
类 型 继承 关系 分 析 (class hierarchy analysis) 
去 虚拟 机 化 《devirtualization ) 
符号 常量 传播 (symbolic constant propagation ) 


数据 流 敏感 重 写 


(flow-sensitive rewrites) 


语言 相关 的 优化 技术 自动 装 箱 消除 Cautobox elimination ) 
(language-specific techniques) 逃逸 分 析 (escape analysis ) 


锁 消 除 (lock elision) 

锁 膨 胀 《lock coarsening ) 

消除 反射 (de-reflection) 

表达 式 提 升 (expression hoisting) 


表达 式 下 沉 (expression sinking) 
内 存 及 代码 位 置 变换 


. 元 余 存储 消除 redundant store elimination ) 
(memory and placement transformation ) 


相 邻 存储 合并 (adjacent store fusion) 
交汇 点 分 离 (merge-point splitting ) 
循环 展开 (loop unrolling ) 

循环 剥离 (loop peeling) 


循环 变换 安全 点 消除 (safepoint elimination ) 
floop transformations) 夺 代 范围 分 离 〈iteration range splitting ) 


范围 检查 消除 (Crange check elimination ) 
循环 向 量化 loop vectorization ) 
内 联 (inlining) 


全 局 代码 调整 全 局 代码 外 提 (global code motion) 
(global code shaping) 基于 热度 的 代码 布局 (heat-based code layout) 


Switch 调整 (switch balancing ) 

本 地 代码 编排 〈local code scheduling ) 

本 地 代码 封包 (local code bundling) 

延迟 档 填 充 (delay slot filling) 

着 色 图 寄存 器 分 配 〈graph-coloring register allocation ) 
线性 打 撒 寄存 器 分 配 〈linear scan register allocation ) 
复写 聚合 (copy coalescing ) 


he EE 


营 量 分 裂 〈〔constant splitting ) 


控制 流 图 变换 


(control flow graph transformation 》 


复写 移 除 (copy removal) 

地 址 模式 匹配 (address mode matching ) 

指令 短 孔 优化 (instruction peepholing) 

基于 确定 有 限 状态 机 的 代码 生成 “DFA-based code generator) 











上 述 的 优化 技术 看 起 来 很 多 ， 而 且 从 名 字 看 都 显得 有 点 “高 深 英 





测 ”， 虽 然 实现 这 些 优化 也 许 确 实 有 些 难 度 ， 但 大 部 分 技术 理解 起 来 都 
并 不 困难 。 为 了 消除 读者 对 这 些 优 化 技术 的 陌生 感 ， 笔 者 举 一 个 简单 的 
例子 ， 即 通过 大 家 熟悉 的 Java 代 码 变化 来 展示 其 中 几 种 优化 技术 是 如 何 
发 挥 作用 的 〈 仅 使 用 Java 代 码 来 表示 而 已 ) 。 首 先 从 原始 代码 开始 ， 如 
代码 清单 11-6 所 示 D。 


代码 清单 11-6 ”优化 前 的 原始 代码 





static class BI 
int value; 

final int get(){ 
return value:; 

} 

} 

public void foo() { 
y=b.get (); 

/nd Stuff....: 





























首先 需要 明确 的 是 ， 这 些 代码 优化 变换 是 建立 在 代码 的 茶 种 中 间 表 
示 或 机 器 码 之 上 ， 绝 不 是 建立 在 Java 源 码 之 上 的 ， 为 了 展示 方便 ， 笔 者 
使 用 了 Java 语 言 的 语法 来 表示 这 些 优化 技术 所 发 挥 的 作用 。 


代码 清单 11-6 的 代码 已 经 非常 简单 了 ， 但 是 仍 有 许多 优化 的 余地 。 
第 一 步 进行 方法 内 联 (Method Inlining) ， 方 法 内 联 的 重要 性 要 高 于 其 
他 优化 措施 ， 它 的 主要 目的 有 两 个 ， 一 是 去 除 方法 调用 的 成 本 《如 建立 
栈 帧 等 ) ， 二 是 为 其 他 优化 建立 恨 好 的 基础 ， 方 法 内 联 膨胀 之 后 可 以 便 


于 在 更 大 范围 上 采取 后 续 的 优化 手段 ， 从 而 获取 更 好 的 优化 效果 。 
此 ， 各 种 编译 器 一 般 部 会 把 内 联 优 化 放 在 优化 序列 的 最 徘 前 位 置 。 内 联 
后 的 代码 如 代码 清单 11-7 所 示 。 


代码 清单 11-7 内 联 后 的 代码 





public void foo() { 

















第 二 步 进行 元 余 访 问 消除 (Redundant Loads Elimination) ， 假 设 代 
码 中 间 注 释 掉 的 "dostuff..…………" 所 代表 的 操作 不 会 改变 b.value 的 值 ， 那 就 
可 以 把 "z=b.value" 蔡 换 为 "z=y"， 因 为 上 一 句 "y=b.value" 已 经 保证 了 变量 
y 与 b.value 是 一 致 的 ， 这 样 就 可 以 不 再 去 访问 对 象 b 的 局 部 变量 了 。 如 果 
把 b.value 看 做 是 一 个 表达 式 ， 那 也 可 以 把 这 项 优化 看 成 是 公共 子 表达 式 
消除 ‘Common Subexpression Elimination) ， 优 化 后 的 代码 如 代码 清单 
11-8 所 示 。 








代码 清单 11-8 ”元 余 存 储 消 除 的 代码 





public void foo(){ 














第 三 步 我 们 进行 复写 传播 〈Copy Propagation) ， 因 为 在 这 段 程 序 
的 逻辑 中 并 没有 必要 使 用 一 个 额外 的 变量 "z"， 它 与 变量 "y" 是 完全 相等 


的 ， 因 此 可 以 使 用 "y" 来 代 符 "z"。 复 写 传 播 之 后 程序 如 代码 清单 11-9 所 
不 。 











代码 清单 11-9 复写 传播 的 代码 


public void foo() { 
y=bD Values 

















第 四 步 我 们 进行 无 用 代码 消除 (Dead Code Elimination) 。 无 用 代 
码 可 能 是 永远 不 会 被 执行 的 代码 ， 也 可 能 是 完全 没有 意义 的 代码 ， 因 
此 ， 它 又 形象 地 称 为 "Dead Code"， 在 代码 清单 11-9 中 ，"y=y" 是 没有 意 
义 的 ， 把 它 消除 后 的 程序 如 代码 清单 11-10 所 示 。 





代码 清单 11-10 ”进行 无 用 代码 消除 的 代码 


public voidq foo(){ 

















经 过 四 次 优化 之 后 ， 代 码 清单 11-10 与 代码 清单 11-6 所 达到 的 效果 是 
一 致 的 ， 但 是 前 者 比 后 者 省 略 了 许多 语句 《体现 在 字 节 码 和 机 器 码 指令 





上 的 差距 会 更 大 ) ， 执 行 效率 也 会 更 高 。 编 译 器 的 这 些 优化 技术 实现 起 
来 也 许 比较 复杂 ， 但 是 要 理解 它们 的 行为 对 于 一 个 普通 的 程序 员 来 说 是 
没有 困难 的 ， 接 下 来 ， 我 们 将 继续 查看 如 下 的 几 项 最 有 代表 性 的 优化 技 
术 是 如 何 运 作 的 ， 它 们 分 别 是 

语言 无 关 的 经 典 优化 技术 之 一 : 公共 子 表达 式 消除 。 

语言 相关 的 经 典 优化 技术 之 一 : 数组 范围 检查 消除 。 

最 重要 的 优化 技术 之 一 : 方法 内 联 。 

最 前 沿 的 优化 技术 之 一 : 逃逸 分 析 。 
[1 本 地 代码 与 字 节 码 两 者 是 无 法 直接 比较 的 ， 准 确 地 说 应 当 是 指 : 由 编 
译 器 优化 得 到 的 本 地 代码 与 由 解释 器 解释 字 节 码 后 实际 执行 的 本 地 代码 
之 间 的 对 比 。 
D2] 地 址 : 
http:/ /wikis.sun.comy/ display/HotSpotIntefnals/PerformanceTacticIndex。 


[3] 本 例 修 改 自 : 
http:/ /download.oracle.com/docs/cd/E13150_01/jrockit_jvm/jrockit/ geninfo. 


11.3.2 ”公共 子 表达 式 消 除 





共 子 表达 式 消 除 是 一 个 普 过 应 用 于 各 种 编译 器 的 经 典 优化 技术 ， 
它 的 含义 是 : 如 果 一 个 表达 式 E 已 经 计算 过 了 ， 并 且 从 先前 的 计算 到 现 
在 E 中 所 有 变量 的 值 都 没有 发 生变 化 ， 那 么 E 的 这 次 出 现 就 成 为 了 公共 

子 表达 式 。 对 于 这 种 表达 式 ， 没 有 必要 花 时 间 再 对 它 进行 计算 ， 只 需要 
直接 用 前 面 计算 过 的 表达 式 结果 代替 E 就 可 以 了 。 如 果 这 种 优化 仅 限 于 
程序 的 基本 块 内 ， 便 称 为 局 部 公共 子 表达 式 消 除 〈Local Common 
Subexpression Elimination) ， 如 果 这 种 优化 的 范围 涵盖 了 多 个 基本 块 ， 
那 就 称 为 全 局 公共 子 表达 式 消 除 (Global Common Subexpression 
Elimination) 。 举 个 简单 的 例子 来 说 明 它 的 优化 过 程 ， 假 设 存在 如 下 代 
个 : 





int d= (c * b) *12+a+ (atb * C) ; 


如 果 这 段 代 码 交 给 Javac 编 译 器 则 不 会 进行 任何 优化 ， 那 生成 的 代 
码 将 如 代码 清单 11-11 所 示 ， 是 完全 遵照 Java 源 码 的 写法 直译 而 成 的 。 





代码 清单 11-11 未 做 任何 优化 的 字 市 码 


iload 2//b 
imul// 计 算 b * c 
bipush 12// 推 入 12 
imul// 计 算 (c * p) *12 
iload 1//a 





iadq// 计 算 (c * b) *12+a 

iload 1//a 

iload 2//b 

iload 3//c 

imul/ /计算 b * c 

iadqq// 计 算 a+b * c 

iadq// 计 算 (c * b) *12+a+ (a+b * c) 
1ISstore 4 








当 这 上 段 代 码 进入 到 虚拟 机 即时 编译 器 后 ， 它 将 进行 如 下 优化 : 编译 
铝 检 测 到 "c* b" 与 "b* c" 是 一 样 的 表达 式 ， 而 且 在 计算 期 间 b 与 c 的 值 是 
不 变 的 。 因 此 ， 这 条 表达 式 就 可 能 被 视 为 : 








int d=E*12+a+ (a+E); 








这 时 ， 编 译 器 还 可 能 (取决 于 哪 种 虚拟 机 的 编译 器 以 及 具体 的 上 下 
文 而 定 ) 进行 男 外 一 种 优化 :代数 化 简 (Algebraic Simplification ) ， 把 
表达 式 变 为 : 





int d=E*13+a*2; 








表达 式 进行 变换 之 后 ， 再 计算 起 来 束 可 以 市 省 一 些 时 间 了 。 如 果 读 
者 还 对 其 他 的 经 典 编 译 优化 拉 术 感 兴趣 ， 可 以 参考 《编译 原理 》〔 俗 
称 “ 龙 书 ”， 推 荐 使 用 Java 的 程序 员 阅 读 2006 年 版 的 “ 紫 龙 书 ”) 中 的 相关 


革 廊 。 


11.3.3 ”数组 边界 检查 消除 


数组 边界 检查 消除 (Array Bounds Checking Elimination ) 是 即时 编 
译 器 中 的 一 项 语言 相关 的 经 典 优化 技术 。 我 们 知道 Java 语 言 是 一 门 动 态 
安全 的 语言 ， 对 数组 的 读 写 访问 也 不 像 C、C++ 那 样 在 本 质 上 是 裸 指针 
操作 。 如 果 有 一 个 数组 foo[]， 在 Java 语 言 中 访问 数组 元 素 foo[i 的 时 候 系 
统 将 会 自动 进行 上 下 界 的 范围 检查 ， 即 检查 ji 必须 满足 ij>=0& &i< 
foo.length 这 个 条 件 ， 否 则 将 抛 出 一 个 运行 时 异常 : 
java.lang.ArrayIndexOutOfBoundsException。 这 对 软件 开发 者 来 说 是 一 件 
很 好 的 事情 ， 即 使 程序 员 没 有 专门 编写 防御 代码 ， 也 可 以 避免 大 部 分 的 
溢出 攻击 。 但 是 对 于 虚拟 机 的 执行 子 系统 来 说 ， 每 次 数组 元 素 的 读 写 都 
带 有 一 次 隐 仿 的 条 件 判定 操作 ， 对 于 拥有 大 量 数组 访问 的 程序 代码 ， 这 
无 疑 也 是 一 种 性 能 负担 。 




















无 论 如 何 ， 为 了 安全 ， 数 组 边界 检查 肯定 是 必须 做 的 ， 但 数组 边界 
检查 是 不 是 必须 在 运行 期 间 一 次 不 漏 地 检查 则 是 可 以 “商量 ”的 事情 。 例 
如 下 面 这 个 简单 的 情况 : 数组 下 标 是 一 个 第 量 ， 如 foo[3]， 只 要 在 编译 
期 根据 数据 流 分 析 来 确定 foo.length 的 值 ， 并 判断 下 标 “3” 没 有 越界 ， 执 
行 的 时 候 就 无 须 判 断 了 。 更 加 和 常见 的 情况 是 数组 访问 发 生 在 循环 之 中 ， 
并 且 使 用 循环 变量 来 进行 数组 访问 ， 如 果 编 译 占 只 要 通过 数据 流 分 析 残 
可 以 判定 循环 变量 的 取 值 范围 永远 在 区 间 [0，foo.lengh) 之 内 ， 那 在 整 








个 循环 中 就 可 以 把 数组 的 上 下 界 检 查 消除 ， 这 可 以 节省 很 多 次 的 条 件 判 
吓 操作 。 


将 这 个 数组 边界 检查 的 例子 放 在 更 高 的 角度 来 看 ， 大 量 的 安全 检查 
令 编写 Java 程 序 比 编写 C/C++ 程序 容易 很 多 ， 如 数组 越界 会 得 到 
ArrayIndexOutOfBoundsException 异 常 ， 空 指针 访问 会 得 到 
NullPointException， 除 数 为 零 会 得 到 ArithmeticException 等 ， 在 C/C++ 程 
序 中 出 现 类 似 的 问题 ， 一 不 小 心 就 会 出 现 Segment Fault 信 号 或 者 
Window 编 程 中 常见 的 “xxx 内 存 不 能 为 Read/Write”* 之 类 的 提示 ， 处 理 不 
好 程序 就 直接 骨 溃 退出 了 。 但 这 些 安全 检查 也 导致 了 相同 的 程序 ，Java 
要 比 C/C++ 做 更 多 的 事情 〈 各 种 检查 判断 》， 这 些 事情 就 成 为 一 种 隐 式 
开销 ， 如 果 处 理 不 好 它们 ， 就 很 可 能 成 为 一 个 Java 语 言 比 C/C++ 更 慢 的 
因素 。 要 消除 这 些 隐 式 开销 ， 除 了 如 数组 边界 检查 优化 这 种 尽 可 能 把 运 
行 期 检查 提 到 编译 期 完成 的 思路 之 外 ， 另 外 还 有 一 种 避免 思路 一 一 隐 式 
异常 处 理 ，Java 中 空 指针 检查 和 算术 运算 中 除数 为 零 的 检查 都 采用 了 这 
种 思路 。 举 个 例子 ， 例 如 程序 中 访问 一 个 对 象 《〈 假 设 对 象 叫 foo) 的 某 
个 属性 (假设 属性 叫 value〉， 那 以 Java 伪 代码 来 表示 虚拟 机 访问 
foo.value 的 过 程 如 下 。 




















if (foo!=null) 1 

return foo.value; 
}elsef{ 
throw new NullPointException (); 


} 





























在 使 用 隐 式 腊 肖 优化 之 后 ， 虚 拟 机 会 把 上 面 伪 代码 所 表示 的 访问 过 
程 变 为 如 下 伪 代 码 。 





tryt 

return foo.value; 
}catch (segment fault) { 
uncommon trap(); 


} 











虚拟 机 会 注册 一 个 Segment Fault 信 号 的 异常 处 理 器 〈 伪 代码 中 的 
uncommon_trap0) ， 这 样 当 foo 不 为 空 的 时 候 ， 对 value 的 访问 是 不 会 额 
外 消耗 一 次 对 foo 判 空 的 开销 的 。 代 价 束 是 当 foo 真 的 为 空 时 ， 必 须 转 入 
到 异常 处 理 器 中 恢复 并 抛 出 NullPointException 异 常 ， 这 个 过 程 必须 从 用 
户 态 转 到 内 核 态 中 处 理 ， 结 束 后 再 回 到 用 户 态 ， 速 度 远 比 一 次 判 空 检查 
慢 。 当 foo 极 少 为 空 的 时 候 ， 隐 式 异 常 优化 是 值得 的 ， 但 假如 foo 经 常 为 
空 的 话 ， 这 样 的 优化 反而 会 让 程序 更 慢 ， 还 好 HotSpot 虚 拟 机 足够 “ 聪 
明 ”， 它 会 根据 运行 期 收集 到 的 Profile 信 息 自动 选择 最 优 方案 。 

















与 语言 相关 的 其 他 消除 操作 还 有 不 少 ， 如 自动 装 箱 消除 (Autobox 
Elimination) 、 安 全 点 消除 〈Safepoint Elimination) 、 消 除 反 射 


CDereflection ) 等 ， 笔 者 就 不 再 一 一 介绍 了 。 


11.3.4 方法 内 联 





在 前 面 的 讲解 之 中 我 们 提 到 过 方法 内 联 ， 它 是 编译 器 最 重要 的 优化 
手段 之 一 ， 除 了 消除 方法 调用 的 成 本 之 外 ， 它 更 重要 的 意义 是 为 其 他 优 
化 手段 建立 良好 的 基础 ， 如 代码 清单 11-12 所 示 的 简单 例子 就 揭示 了 内 
联 对 其 他 优化 手段 的 意义 : 事实 上 testInline() 方 法 的 内 部 全 部 都 是 无 用 
的 代码 ， 如 果 不 做 内 联 ， 后 续 即 使 进行 了 无 用 代码 消除 的 优化 ， 也 无 法 
发 现任 何 "Dead Code"， 因 为 如 果 分 开 来 看 ，foo() 和 testInline() 两 个 方法 
里 面 的 操作 都 可 能 是 有 意义 的 。 


代码 清单 11-12 ”未 做 任何 优化 的 字 市 码 








public static void foo (Object obj) { 

if (obj!=nu11) { 

System.out.println ("do something"); 

} 

} 

public static void testInline (String[]args) { 
Object obj=null; 

foo (obj); 

} 














方法 内 联 的 优化 行为 看 起 来 很 简单 ， 不 过 是 把 目标 方法 的 代码 “ 复 
制 * 到 发 起 调用 的 方法 之 中 ， 避 免 发 生 真实 的 方法 调用 而 已 。 但 实际 上 
Java 虚 拟 机 中 的 内 联 过 程 远 远 没有 那么 简单 ， 因 为 如 果 不 古 即时 编译 器 
做 了 一 些 特别 的 努力 ， 按 照 经 典 编译 原理 的 优化 理论 ， 大 多 数 的 Java 方 





法 都 无 法 进行 内 联 。 


无 法 内 联 的 原因 其 实在 第 8 章 中 讲解 Java 方 法 解析 和 分 浜 调用 的 时 
候 就 已 经 介绍 过 。 只 有 使 用 invokespecial 指 令 调用 的 私有 方法 、 实 例 构 
造 器 、 父 类 方法 以 及 使 用 invokestatic 指 令 进行 调用 的 静态 方法 才 是 在 编 
译 期 进行 解析 的 ， 除 了 上 述 4 种 方法 之 外 ， 其 他 的 Java 方 法 调用 都 需要 
在 运行 时 进行 方法 接收 者 的 多 态 选 择 ， 并 且 都 有 可 能 存在 多 于 一 个 版 本 
的 方法 接收 者 (最 多 再 除去 被 final 修 饰 的 方法 这 种 特殊 情况 ， 尺 管 它 使 
用 invokevirtual 指 令 调 用 ， 但 也 是 非 虚 方 法 ，Java 语 言 规 范 中 明确 说 明了 
这 点 ) ， 简 而 言 之 ，Java 语 言 中 默认 的 实例 方法 是 虚 方 法 。 








对 于 一 个 虚 方 法 ， 编 译 期 做 内 联 的 时 候 根本 无 法 确定 应 该 使 用 哪个 
方法 版 本 ， 如 果 以 代码 清单 11-7 中 把 "b.getQ0" 内 联 为 "b.value" 为 例 的 话 ， 
束 是 不 依赖 上 下 文殊 无 法 确定 b 的 实际 类 型 是 什么 。 假 如 有 ParentB 和 
SubB 两 个 具有 继承 关系 的 类 ， 并 且 子 类 重 写 了 父 类 的 get() 方 法 ， 那 么 ， 
古 要 执行 父 类 的 get0) 方 法 还 是 子 类 的 get() 方 法 ， 需 要 在 运行 期 才能 确 
定 ， 编 译 期 无 法 得 出 结论 。 





由 于 Java 语 言 提倡 使 用 面向 对 象 的 编程 方式 进行 编程 ， 而 Java 对 象 
的 方法 默认 就 是 虚 方法 ， 因 此 Java 则 接 误 励 了 程序 员 使 用 大 量 的 虚 方 法 
来 完成 程序 逻辑 。 根 据 上 面 的 分 析 ， 如 果 内 联 与 虚 方 法 之 间 产 生 “ 耶 
盾 ”， 那 该 怎么 办 呢 ? 是 不 是 为 了 提高 执行 性 能 ， 就 要 到 处 使 用 final 关 
键 字 去 修饰 方法 呢 ? 





为 了 解决 虚 方法 的 内 联 问题 ，Java 虚 拟 机 设计 团队 想 了 很 多 办 法 ， 
首先 是 引入 了 一 种 名 为 “类 型 继承 关系 分 析 ”(Class Hierarchy 
Analysis,CHA ) 的 技术 ， 这 是 一 种 基于 整个 应 用 程序 的 类 型 分 析 技 术 ， 
它 用 于 确定 在 目前 已 加 载 的 类 中 ， 东 个 接口 是 否 有 多 于 一 种 的 实现 ， 茶 


个 类 是 否 存 在 子 类 、 子 类 是 否 为 抽象 类 等 信息 。 











编译 圳 在 进行 内 联 时 ， 如 果 和 是 非 虚 方法 ， 那 么 直接 进行 内 联 就 可 以 
了 ， 这 时 候 的 内 联 是 有 稳定 前 提 保 障 的 。 如 果 遇 到 虚 方 法 ， 则 会 同 CHA 
查询 此 方法 在 当前 程序 下 古 否 有 多 个 目标 版 本 可 供 选择 ， 如 果 碍 询 结果 
只 有 一 个 版 本 ， 那 也 可 以 进行 内 联 ， 不 过 这 种 内 联 束 属于 激进 优化 ， 需 
要 预 留 一 个 “逃生 门 ”(Guard 条 件 不 成 立时 的 Slow Path) ， 称 为 守护 内 
联 (Guarded Inlining) 。 如 果 程 序 的 后 续 执 行 过 程 中 ， 虚 拟 机 一 直 没 有 
加 载 到 会 令 这 个 方法 的 接收 者 的 继承 关系 发 生变 化 的 类 ， 那 这 个 内 联 优 
化 的 代码 就 可 以 一 直 使 用 下 去 。 但 如 果 加 载 了 导致 继承 关系 发 生变 化 的 
新 类 ， 那 就 需要 抛弃 已 经 编译 的 代码 ， 退 回 到 解释 状态 执行 ， 或 者 重新 
进行 编译 。 














如 末 癌 CHA 碍 询 出 来 的 结果 是 有 多 个 版 本 的 目标 方法 可 供 选 择 ， 则 
编译 圳 还 将 会 进行 最 后 一 次 努力 ， 使 用 内 联 缓存 〈Inline Cache) 来 完成 
方法 内 联 ， 这 是 一 个 建立 在 目标 方法 正常 入 口 之 前 的 缓存 ， 它 的 工作 原 
理 大 致 是 : 在 未 发 生 方法 调用 之 前 ， 内 联 绥 存 状态 为 空 ， 当 第 一 次 调用 
发 生 后 ， 绥 存 记录 下 方法 接收 者 的 版 本 信息 ， 并 且 每 次 进行 方法 调用 时 








都 比较 接收 者 版 本 ， 如 果 以 后 进来 的 每 次 调用 的 方法 接收 者 版 本 都 是 一 
样 的 ， 那 这 个 内 联 还 可 以 一 直 用 下 去 。 如 果 发 生 了 方法 接收 者 不 一 致 的 
情况 ， 束 说 明 程 序 真 正 使 用 了 虚 方 法 的 多 态 特 性 ， 这 时 才 会 取消 内 联 ， 
便 找 虚 方 法 表 进 行 方法 分 派 。 














所 以 说 ， 在 许多 情况 下 虚拟 机 进行 的 内 联 都 是 一 种 油 进 优化 ， 激 进 
优化 的 手段 在 高 性 能 的 商用 虚拟 机 中 很 常见 ， 除 了 内 联 之 外 ， 对 于 出 现 
概率 很 小 (通过 经 验 数 据 或 解释 器 收集 到 的 性 能 监控 信息 确定 概率 大 
小 ) 的 隐 式 异 第 、 使 用 概率 很 小 的 分 支 等 都 可 以 被 激进 优化 “ 移 除 ”， 如 
打 真 的 出 现 了 小 概率 事件 ， 这 时 才 会 从 “逃生 门 回 到 解释 状态 重新 执 


行 。 


11.3.5 “逃逸 分 析 


逃逸 分 析 〈Escape Analysis) 是 目前 Java 虚 拟 机 中 比较 前 治 的 优化 
技术 ， 它 与 类 型 继承 关系 分 析 一 样 ， 并 不 是 直接 优化 代码 的 手段 ， 而 是 
为 其 他 优化 手段 提供 依据 的 分 析 技 术 。 





逃逸 分 析 的 基本 行为 就 是 分 析 对 象 动态 作用 域 : 当 一 个 对 象 在 方法 
中 被 定义 后 ， 它 可 能 被 外 部 方法 所 引用 ， 例 如 作为 调用 参数 传递 到 其 他 
方法 中 ， 称 为 方法 逃逸 。 甚 至 还 有 可 能 被 外 部 线程 访问 到 ， 璧 如 赋值 给 
类 变量 或 可 以 在 其 他 线程 中 访问 的 实例 变量 ， 称 为 线程 逃逸 。 


如 果 能 证 明 一 个 对 象 不 会 逃逸 到 方法 或 线程 之 外 ， 也 就 是 别 的 方法 
或 线程 无 法 通过 任何 途径 访问 到 这 个 对 象 ， 则 可 能 为 这 个 变量 进行 一 些 
高 效 的 优化 ， 如 下 所 示 。 


栈 上 分 配 〈Stack Allocation) : Java 虚 拟 机 中 ， 在 Java 堆 上 分 配 创 
建 对 象 的 内 存 空间 几乎 是 Java 程 序 员 都 清楚 的 常识 了 ，Java 堆 中 的 对 象 
对 于 各 个 线程 都 是 共享 和 可 见 的 ， 只 要 持 有 这 个 对 象 的 引用 ， 就 可 以 访 
问 堆 中 存储 的 对 象 数 据 。 虚 拟 机 的 垃圾 收集 系统 可 以 回收 堆 中 不 再 使 用 
的 对 象 ， 但 回收 动作 无 论 是 筛选 可 回收 对 象 ， 还 是 回收 和 整理 内 存 都 需 
要 耗费 时 间 。 如 果 确 定 一 个 对 象 不 会 逃逸 出 方法 之 外 ， 那 让 这 个 对 象 在 
栈 上 分 配 内 存 将 会 是 一 个 很 不 错 的 主意 ， 对 象 所 占用 的 内 存 空间 就 可 以 








随 栈 帧 出 栈 而 销毁 。 在 一 般 应 用 中 ， 不 会 逃逸 的 局 部 对 象 所 占 的 比例 很 
大 ， 如 果 能 使 用 栈 上 分 配 ， 那 大 量 的 对 象 束 会 随 着 方法 的 结束 而 自动 销 
毁 了 ， 垃 圾 收集 系统 的 压力 将 会 小 很 多 。 


同步 消除 Synchronization Elimination ) : 线程 同步 本 身 是 一 个 相 
对 耗 时 的 过 程 ， 如 采 逃 逸 分 析 能 够 确定 一 个 变量 不 会 逃逸 出 线程 ， 无 法 
被 其 他 线程 访问 ， 那 这 个 变量 的 读 写 肯定 就 不 会 有 竞争 ， 对 这 个 变量 实 
施 的 同步 措施 也 就 可 以 消除 抒 。 


标量 伏 换 (Scalar Replacement) : 标量 (Scalar) 是 指 一 个 数据 已 
经 无 法 再 分 解 成 更 小 的 数据 来 表示 了 ，Java 虚 拟 机 中 的 原始 数据 类 型 
(int、long 等 数值 类 型 以 及 reference 类 型 等 ) 都 不 能 再 进一步 分 解 ， 它 
们 就 可 以 称 为 标量 。 相 对 的 ， 如 琳 一 个 数据 可 以 继续 分 解 ， 那 它 残 称 作 
聚合 量 (Aggregate〉，Java 中 的 对 象 束 是 最 典型 的 聚合 量 。 如 果 把 一 个 
Java 对 象 拆散 ， 根 据 程 序 访问 的 情况 ， 将 其 使 用 到 的 成 员 变 量 恢复 原始 
类 型 来 访问 就 叫做 标量 蔡 换 。 如 果 逃 逸 分 析 证 明 一 个 对 象 不 会 被 外 部 访 
问 ， 并 且 这 个 对 象 可 以 被 拆散 的 话 ， 那 程序 真正 执行 的 时 候 将 可 能 不 创 
建 这 个 对 象 ， 而 改 为 直接 创建 它 的 奉 干 个 被 这 个 方法 使 用 到 的 成 员 变 量 
来 代替 。 将 对 象 拆 分 后 ， 除 了 可 以 让 对 象 的 成 员 变 量 在 栈 上 〈 栈 上 存储 
的 数据 ， 有 很 大 的 概率 会 被 虚拟 机 分 配 至 物理 机 器 的 局 速 寄存 右 中 存 
储 ) 分 配 和 读 写 之 外 ， 还 可 以 为 后 续 进 一 步 的 优化 手段 创建 条 件 。 














关于 逃逸 分 析 的 论文 在 1999 年 就 已 经 发 表 ， 但 直到 Sun JDK 1.6 才 实 


现 了 逃逸 分 析 ， 而 且 直 到 现在 这 项 优化 尚未 足够 成 熟 ， 仍 有 很 大 的 改进 
余地 。 不 成 熟 的 原因 主要 是 不 能 保证 逃逸 分 析 的 性 能 收益 必定 高 于 它 的 
消耗 。 如 果 要 完全 准确 地 判断 一 个 对 象 是 否 会 逃逸 ， 需 要 进行 数据 流 敏 
感 的 一 系列 复杂 分 析 ， 从 而 确定 程序 各 个 分 支 执行 时 对 此 对 象 的 影响 。 
这 是 一 个 相对 高 耗 时 的 过 程 ， 如 果 分 析 完 后 发 现 没 有 几 个 不 逃逸 的 对 

象 ， 那 这 些 运行 期 耗 用 的 时 间 就 白白 浪费 了 ， 所 以 目前 虚拟 机 只 能 采用 
不 那么 准确 ， 但 时 间 压 力 相 对 较 小 的 算法 来 完成 逃逸 分 析 。 还 有 一 点 

是 ， 基 于 逃逸 分 析 的 一 些 优化 手段 ， 如 上 面 提 到 的 “ 栈 上 分 配 ”， 由 于 

HotSpot 虚 拟 机 目前 的 实现 方式 导致 栈 上 分 配 实现 起 来 比较 复杂 ， 因 此 
在 HotSpot 中 暂时 还 没有 做 这 项 优化 。 

















在 测试 结果 中 ， 实 施 逃 逸 分 析 后 的 程序 在 MicroBenchmarks 中 往往 
能 运行 出 不 错 的 成 绩 ， 但 是 在 实际 的 应 用 程序 ， 尤 其 是 大 型 程序 中 反而 
发 现实 施 逃 逸 分析 可 能 出 现 效果 不 稳定 的 情况 ， 或 因 分 析 过 程 耗 时 但 却 
无 法 有 效 判 别 出 非 逃逸 对 象 而 导致 性 能 〈 即 时 编译 的 收益 ) 有 所 下 降 ， 
所 以 在 很 长 的 一 段 时 间 里 ， 即 使 是 Server Compiler， 也 默认 不 开启 逃逸 
分 析 册 ， 甚 至 在 某 些 版 本 〈 如 JDK 1.6 Update 18) 中 还 曾经 短暂 地 完全 
禁止 了 这 项 优化 。 














如 果 有 需要 ， 并 且 确 认 对 程序 运行 有 益 ， 用 户 可 以 使 用 参数 - 
XX:+DoEscapeAnalysis 来 手动 开启 逃 逸 分 析 ， 开 局 之 后 可 以 通过 参数 - 
XX:+PrintEscapeAnalysis 来 得 看 分 析 结 果 。 有 了 逃逸 分 析 文 持 之 后 ， 用 


户 可 以 使 用 参数 -XX:+EliminateAllocations 来 开启 标量 替换 ， 使 用 
+XX:+EliminateLocks 来 开启 同步 消除 ， 使 用 参数 - 


XX:+PrintEliminateAllocations 查 看 标量 的 替换 情况 。 








尽管 目前 逃逸 分 析 的 技术 仍 不 是 十 分 成 熟 ， 但 是 它 却 是 即时 编译 器 
优化 技术 的 一 个 重要 的 发 展 方向 ， 在 今后 的 虚拟 机 中 ， 逃 逸 分 析 技 术 肯 
定 会 文 撑 起 一 系列 实用 有 效 的 优化 技术 。 





[1 在 JDK 1.6 Update 23 的 Server Compilef 中 才 开 始 默认 开启 了 逃 选 分 析 。 


11.4 Java 与 C/C++ 的 编译 器 对 比 


大 多 数 程序 员 都 认为 C/C++ 会 比 Java 语 言 快 ， 其 至 觉得 从 Java 语 言 
诞生 以 来 “执行 速度 缓慢 ?的 帽子 就 应 当 扣 在 它 的 头 项 ， 这 种 观点 的 出 现 
是 由 于 Java 刚 出 现 的 时 候 即 时 编译 技术 还 不 成 熟 ， 主 要 靠 解 释 器 执行 的 
Java 语 言 性 能 确实 比较 低下 。 但 目前 即时 编译 技术 已 经 十 分 成 熟 ，Java 
语言 有 可 能 在 速度 上 与 C/C++ 一 争 高 下 吗 ? 要 想 知 道 这 个 问题 的 答案 ， 


让 我 们 从 两 者 的 编译 器 谈 起 中。 











Java 与 C/C++ 的 编译 器 对 比 实 际 上 代表 了 最 经 典 的 即时 编译 器 与 静 
态 编译 器 的 对 比 ， 很 大 程度 上 也 决定 了 Java 与 C/C++ 的 性 能 对 比 的 结 
果 ， 因 为 无 论 是 C/C++ 还 是 Java 代 人 码 ， 最 终 编 详 之 后 个 机 器 执行 的 都 古 
本 地 机 器 人 码 ， 哪 种 语言 的 性 能 更 高 ， 除 了 它们 上 自 映 的 API 库 实现 得 好 坏 
以 外 ， 其 余 的 比较 融 成 了 一 场 “ 拼 编译 器 ?和 * 拼 输出 代码 质量 ”的 游戏 。 
当然 ， 这 种 比较 也 是 吻 除 了 开发 效率 的 片面 对 比 ， 语 言 间 讨 优 热 劣 、 谁 
快 谁 慢 的 问题 部 是 很 难 有 结果 的 争论 ， 下 面 我 们 就 回 到 正题 ， 看 看 这 两 
种 语言 的 编译 器 各 有 何 种 优势 。 


Java 虚 拟 机 的 即时 编译 器 与 C/C++ 的 静态 优化 编译 器 相 比 ， 可 能 会 
由 于 下 列 这 些 原 因而 导致 输出 的 本 地 代码 有 一 些 劣势 〈 下 面 列 举 的 也 包 
括 一些 虚 拟 机 执行 子 系统 的 性 能 劣势 ) : 








第 一 ， 因 为 即时 编译 器 运行 占用 的 是 用 户 程 序 的 运行 时 间 ， 共 有 很 
大 的 时 间 压 力 ， 它 能 提供 的 优化 手段 也 严重 受制 于 编译 成 本 。 如 果 编 译 
速度 不 能 达到 要 求 ， 那 用 户 将 在 局 动 程序 或 程序 的 某 部 分 察觉 到 重大 延 
人 迟 ， 这 扣 使 得 即时 编译 此 不 敢 随 便 引 入 大 规模 的 优化 拉 术 ， 而 编译 的 时 
间 成 本 在 静态 优化 编译 器 中 并 不 是 主要 的 关注 斥 。 




















第 二 ，Java 语 言 是 动态 的 类 型 安全 语言 ， 这 就 意味 着 需要 由 虚拟 机 
来 确保 程序 不 会 违反 语言 语义 或 访问 非 结 构 化 内 存 。 从 实现 层面 上 看 ， 
这 就 意味 着 虚拟 机 必须 频繁 地 进行 动态 检查 ， 如 实例 方法 访问 时 检查 空 
指针 、 数 组 元 系 访 问 时 检查 上 下 界 范 围 、 类 型 转换 时 检查 继承 关系 等 。 
对 于 这 类 程序 代码 没有 明确 写 出 的 检查 行为 ， 尺 管 编译 器 会 努力 进行 优 
化 ， 但 是 总 体 上 仍然 要 消耗 不 少 的 运行 时 间 。 








第 三 ，Java 语 言 中 虽然 没有 virtual 关 键 字 ， 但 是 使 用 虚 方 法 的 频率 
却 远 远大 于 C/C++ 语 言 ， 这 意味 痢 运 行 时 对 方法 接收 者 进行 多 态 选 择 的 
频率 要 远 远 大 于 C/C++ 语 言 ， 也 意味 着 即时 编译 需 在 进行 一 些 优化 《如 
前 面 提 到 的 方法 内 联 ) 时 的 难度 要 远大 于 C/C++ 的 静态 优化 编译 需 。 











第 四 ，Java 语 言 是 可 以 动态 扩展 的 语言 ， 运 行 时 加 载 新 的 类 可 能 改 
变 程序 类 型 的 继承 关系 ， 这 使 得 很 多 全 局 的 优化 都 难以 进行 ， 因 为 编译 
铝 无 法 看 见 程 序 的 全 貌 ， 许 多 全 局 的 优化 措施 都 只 能 以 激进 优化 的 方式 
来 完成 ， 编 译 器 不 得 不 时 刻 注意 并 随 着 类 型 的 变化 而 在 运行 时 撤销 或 重 
新 进行 一 些 优化 。 





第 五 ，Java 语 言 中 对 象 的 内 存 分 配 都 是 堆 上 进行 的 ， 只 有 方法 中 的 
局 部 变量 才能 在 栈 上 分 配 疝 。 而 C/C++ 的 对 象 则 有 多 种 内 存 分 配方 式 ， 
既 可 能 在 堆 上 分 配 ， 又 可 能 在 栈 上 分 配 ， 如 果 可 以 在 栈 上 分 配 线程 私有 
的 对 象 ， 将 减轻 内 存 回收 的 压力 。 另 外 ，C/C++ 中 主要 由 用 户 程序 代码 
来 回收 分 配 的 内 存 ， 这 就 不 存在 无 用 对 象 筛选 的 过 程 ， 因 此 效率 上 《 仅 
指 运行 效率 ， 排 除了 开发 效率 ) 也 比 垃圾 收集 机 制 要 高 。 








上 面 说 了 一 大 堆 Java 语 言 相对 C/C++ 的 劣势 ， 不 是 说 Java 就 真 的 不 
如 C/C++ 了 ， 相 信 读 者 也 注意 到 了 ，Java 语 言 的 这 些 性 能 上 的 和 劣势 都 是 
为 了 换取 开发 效率 上 的 优势 而 付出 的 代价 ， 动 态 安全 、 动 态 扩 展 、 垃 专 
回收 这 些 “ 拖 后 腿 ” 的 特性 都 为 Java 语 言 的 开发 效率 做 出 了 很 大 贡献 。 





何况 ， 还 有 许多 优化 是 Java 的 即时 编译 器 能 做 而 C/C++ 的 静态 优化 
编译 器 不 能 做 或 者 不 好 做 的 。 例 如 ， 在 C/C++ 中 ， 别 名 分 析 (Alias 
Analysis) 的 难度 就 要 远 高 于 Java。Java 的 类 型 安全 保证 了 在 类 似 如 下 代 
码 中 ， 只 要 ClassA 和 ClassB 没 有 继承 关系 ， 那 对 象 objA 和 objB 就 绝 不 可 
能 是 同一 个 对 象 ， 即 不 会 是 同一 块 内 存 两 个 不 同 别名 。 





void foo (ClassA objA,ClassB objB) { 

objA.x=123; 

objB.y=456; 

// 只 要 objB.y 不 是 objA.x 的 别名 ， 下 面 就 可 以 保证 输出 为 123 
print (objA.x); 

} 























确定 了 objA 和 objB 并 非 对 方 的 别名 后 ， 许 多 与 数据 依赖 相关 的 优化 


才 可 以 进行 〈 重 排序 、 变 量 代 换 ) 。 有 具体 到 这 个 例子 中 ， 就 是 无 须 担 心 
objB.y 其 实 与 objA.x 指 问 同一 块 内 存 ， 这 样 就 可 以 安全 地 确定 打印 语句 
中 的 objA.x 为 123。 





Java 编 译 器 男 外 一 个 红利 是 由 它 的 动态 性 所 融 来 的 ， 由 于 C/C++ 编 
译 器 所 有 优化 都 在 编译 期 完成 ， 以 运行 期 性 能 监控 为 基础 的 优化 措施 它 
都 无 法 进行 ， 如 调用 频率 预测 〈Call Frequency Prediction) 、 分 支 频率 
预测 〈Branch Frequency Prediction ) 、 裁 前 未 被 选择 的 分 支 《Untaken 


Branch Pruning) 等 ， 这 些 都 会 成 为 Java 语 言 独 有 的 性 能 优势 。 





[C/C++ 与 Java 就 优 就 劣 、 谁 快 谁 慢 这 类 话题 已 经 争论 了 十 几 年 ， 双 方 
的 支持 者 从 来 都 没有 说 服 过 对 方 ， 有 朋友 好 意 提 醒 过 笔者 不 要 跳 入 这 种 
语言 性 能 争论 的 “ 火 坑 ”， 把 这 节 移 除 挤 。 笔 者 在 此 也 特别 说 明 ， 本 节 
的 目的 仅 是 从 编译 和 执行 的 角度 来 探讨 两 者 的 差异 ， 并 不 是 去 评判 就 优 
就 劣 。 

[2]Java 中 非 逃 选 对 象 的 标量 替换 优化 可 以 看 做 是 一 种 高 度 优 化 后 的 栈 上 
分 配 ， 但 它 相 当 于 把 对 象 拆散 成 局 部 变量 再 进行 的 栈 上 分 配 ， 而 不 是 

C/C++ 那 种 程序 代码 可 控 的 栈 上 分 配方 式 。 


11.5 本章 小 结 


第 10~11 两 章 分 别 介绍 了 Java 程 序 从 源码 编译 成 字 市 码 和 从 字 市 码 
编译 成 本 地 机 器 人 码 的 过 程 ，Javac 字 市 码 编译 占 与 虚拟 机 内 的 JIT 编 译 费 
的 执行 过 程 合 并 起 来 其 实 就 等 同 于 一 个 传统 编译 占 所 执行 的 编译 过 程 。 





本 章 中 ， 我 们 着 重 了 解 了 虚拟 机 的 热点 探测 方法 、HotSpot 的 即时 
编译 器 、 编 译 触发 条 件 ， 以 及 如 何 从 虚拟 机 外 部 观察 和 分 析 JIT 编 译 的 
数据 和 结果 ， 还 选择 了 几 种 常见 的 编译 期 优化 技术 进行 讲解 。 对 Java 编 
译 器 的 深入 了 解 ， 有 助 于 在 工作 中 分 辨 哪些 代码 是 编译 器 可 以 帮 我 们 处 
理 的 ， 哪 些 代码 需要 目 己 调节 以 便 更 适合 编译 器 的 优化 。 
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并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定 律 代 蔡 摩 尔 定律 器 成 为 计算 机 
性 能 发 展 源 动 力 的 根本 原因 ， 也 是 人 类 “压榨 ?计算 机 运算 能 力 的 最 有 力 
武 右 。 





12.1 概述 


多 任务 处 理 在 现代 计算 机 操作 系统 中 几乎 已 是 一 项 必 备 的 功能 

在 许多 情况 下 ， 让 计算 机 同时 去 做 几 件 事情 ， 不 仅 是 因为 计算 机 的 运算 
能 力 强 大 了 ， 还 有 一 个 很 重要 的 原因 是 计算 机 的 运算 速度 与 它 的 存储 和 
通信 子 系统 速度 的 差距 大大， 大 量 的 时 间 都 花费 在 磁盘 IO、 网 络 通信 
或 者 数据 库 访 问 上 。 如 果 不 希 望 处 理 器 在 大 部 分 时 间 里 都 处 于 等 待 其 他 
资源 的 状态 ， 就 必须 使 用 一 些 手段 去 把 处 理 器 的 运算 能 力 “ 压 榨 ? 出 来 ， 
否则 就 会 造成 很 大 的 浪费 ， 而 让 计算 机 同时 处 理 几 项 任务 则 是 最 容易 想 
到 、 也 被 证 明 是 非 第 有 效 的 “压榨 ”手段 。 




















除了 充分 利用 计算 机 处 理 器 的 能 力 外 ， 一 个 服务 端 同时 对 多 个 客户 
端 提供 服务 则 是 另 一 个 更 具体 的 并 发 应 用 场景 。 衡 量 一 个 服务 性 能 的 高 
低 好 坏 ， 每 秒 事务 处 理 数 (Transactions Per Second,TPS) 是 最 重要 的 指 
标 之 一 ， 它 代表 着 一 秒 内 服务 端 平均 能 响应 的 请 求 总 数 ， 而 TPS 值 与 程 





序 的 并 发 能 力 又 有 非常 密切 的 关系 。 对 于 计算 量 相同 的 任务 ， 程 序 线程 
并 发 协调 得 越 有 条 不 率 ， 效 率 目 然 误 会 越 高 ; 反之 ， 线 程 之 间 频 繁 阻塞 
甚至 死 锁 ， 将 会 大 大 降低 程序 的 并 发 能 





服务 端 是 Java 语 言 最 擅长 的 领域 之 一 ， 这 个 领域 的 应 用 占 了 Java 应 
用 中 最 大 的 一 块 份额 时 ， 不 过 如 何 写 好 并 发 应 用 程序 却 又 是 服务 端 程序 
开发 的 难点 之 一 ， 处 理 好 并 发 方面 的 问题 通常 需要 更 多 的 编码 经 验 来 文 
持 。 羊 好 Java 语 言 和 虚拟 机 提供 了 许多 工具 ， 把 并 有 编程 的 门槛 降低 了 
不 少 。 并 且 各 种 中 间 件 服务 嚣 、 各 类 框架 都 努力 地 蔡 程 序 员 处 理 尽 可 能 
多 的 线程 并 发 细节 ， 使 得 程序 员 在 编码 时 能 更 关注 业务 逻辑 ， 而 不 是 人 花 
费 大 部 分 时 间 去 关注 此 服务 会 同时 被 多 少 人 调用 、 如 何 协 调 硬件 资源 。 
无 论语 言 、 中 间 件 和 框架 如 何 先进 ， 开 发 人 员 都 不 能 期 望 它们 能 独立 完 
成 所 有 并 发 处 理 的 事情 ， 了 解 并 发 的 内 大 也 是 成 为 一 个 高 级 程序 员 不 可 
缺少 的 谍 程 。 








“高 效 并 发 ”是 本 书 讲解 Java 虚 拟 机 的 最 后 一 部 分 ， 将 会 癌 读 者 介绍 
虚拟 机 如 何 实现 多 线程 、 多 线程 之 间 由 于 共享 和 竞争 数据 而 导致 的 一 系 
列 问题 及 解决 方案 。 








[Amdahl 定 律 通过 系统 中 并 行 化 与 品行 化 的 比重 来 描述 多 处 理 器 系统 能 
获得 的 运算 加 速 能 力 ， 摩 尔 定 律 则 用 于 描述 处 理 器 晶体 管 数 量 与 运行 效 
率 之 间 的 发 展 关系 。 这 两 个 定律 的 更 替代 表 了 近年 来 硬件 发 展 从 追求 处 


理 器 频率 到 追求 多 核心 并 行 处 理 的 发 展 过 程 。 


DB 必须 以 代码 的 总 体 规 模 来 衡量 ， 服 务 端 应 用 不 能 与 JavaCatrd、 移 动 终 


端 这 些 领域 去 比 绝对 数量 。 


12.2 ”硬件 的 效率 与 一 致 性 


在 正式 讲解 Java 虚 拟 机 并 发 相关 的 知识 之 前 ， 我 们 先 花 费 一 点 时 间 
去 了 解 一 下 物理 计算 机 中 的 并 发 问题 ， 物 理 机 遇 到 的 并 发 问题 与 虚拟 机 
中 的 情况 有 不 少 相 似 之 处 ， 物 理 机 对 并 发 的 处 理 方案 对 于 虚拟 机 的 实现 
也 有 相当 大 的 参考 意义 。 





“让 计算 机 并 发 执行 春 干 个 运算 任务 ”与 “更 充分 地 利用 计算 机 处 理 
器 的 效能 ”之 间 的 因果 关系 ， 看 起 来 顺理成章 ， 实 际 上 它们 之 间 的 关系 
并 没有 想象 中 的 那么 简单 ， 其 中 一 个 重要 的 复杂 性 来 源 是 绝 大 多 数 的 运 
算 任务 都 不 可 能 只 靠 处 理 器 “计算 ?就 能 完成 ， 处 理 器 至 少 要 与 内 存 交 
互 ， 如 读 取 运 算数 据 、 存 储 运 算 结果 等 ， 这 个 IO 操作 是 很 难 消除 的 
(无 法 仅 靠 寄存 右 来 完成 所 有 运算 任务 ) 。 由 于 计算 机 的 存储 设备 与 处 
理 絮 的 运算 速度 有 几 个 数量 级 的 差距 ， 所 以 现代 计算 机 系统 都 不 得 不 加 
入 一 层 读 与 速度 尽 可 能 接近 处 理 需 运算 速度 的 高 速 缓 仔 〈Cache) 来 作 
为 内 存 与 处 理 器 之 间 的 缓冲 : 将 运算 需要 使 用 到 的 数据 复制 到 缓存 中 ， 
让 运算 能 快速 进行 ， 当 运算 结束 后 再 从 缓存 同步 回 内 存 之 中 ， 这 样 处 理 
需 束 无 须 等 待 缓慢 的 内 存 读 写 了 。 














基于 高 速 缓存 的 存储 交互 很 好 地 解决 了 处 理 吉 与 内 存 的 速度 矛盾 ， 
但 是 也 为 计算 机 系统 带 来 更 高 的 复杂 度 ， 因 为 它 引 入 了 一 个 新 的 问题 : 














绥 存 一 致 性 〈Cache Coherence) 。 在 多 处 理 器 系统 中 ， 每 个 处 理 器 都 有 
自己 的 高 速 缓存 ， 而 它们 又 共享 同一 主 内 存 (Main Memory) ， 如 图 12- 
1 所 示 。 当 多 个 处 理 器 的 运算 任务 都 涉及 同一 块 主 内 存 区 域 时 ， 将 可 能 
导致 各 自 的 缓存 数据 不 一 致 ， 如 果真 的 发 生 这 种 情况 ， 那 同步 回 到 主 内 
存 时 以 谁 的 缓存 数据 为 准 呢 ? 为 了 解决 一 致 性 的 问题 ， 需 要 各 个 处 理 需 
访问 缓存 时 都 遵循 一 些 协议 ， 在 读 写 时 要 根据 协议 来 进行 操作 ， 这 类 协 
议 有 MSI、MESI (Tllinois Protocol) 、MOSI、Synapse、Firefly 及 Dragon 
Protocol 等 。 在 本 章 中 将 会 多 次 提 到 的 “内 存 模型 ”一 词 ， 可 以 理解 为 在 

特定 的 操作 协议 下 ， 对 特定 的 内 存 或 高 速 缓存 进行 读 写 访 问 的 过 程 抽 

象 。 不 同 架 构 的 物理 机 器 可 以 拥有 不 一 样 的 内 存 模型 ， 而 Java 虚 拟 机 也 
有 自己 的 内 存 模型 ， 并 且 这 里 介绍 的 内 存 访问 操作 与 硬件 的 缓存 访问 操 
作 具 有 很 高 的 可 比 性 。 


























处 理 顺 高 速 缓存 


图 12-1 处 理 器 、 高 速 缓存 、 主 内 存 间 的 交互 关系 








除了 增加 高 速 缓存 之 外 ， 为 了 使 得 处 理 器 内 部 的 运算 单元 能 尽量 被 





充分 利用 ， 处 理 需 可 能 会 对 输入 代码 进行 乱 序 执行 “Out-Of-Order 
Execution) 优化 ， 处 理 器 会 在 计算 之 后 将 乱 序 执行 的 结果 重组 ， 保 证 该 
结果 与 顺序 执行 的 结果 是 一 致 的 ， 但 并 不 保证 程序 中 各 个 语句 计算 的 先 
后 顺序 与 输入 代码 中 的 顺序 一 致 ， 因 此 ， 如 果 存 在 一 个 计算 任务 依赖 忆 
外 一 个 计算 任务 的 中 间 结 果 ， 那 么 其 顺序 性 并 不 能 靠 代码 的 先后 顺序 来 
保证 。 与 处 理 器 的 乱 序 执行 优化 类 似 ，Java 虚 拟 机 的 即时 编译 器 中 也 有 
类 似 的 指令 重 排 序 (Instruction Reorder) 优化 。 





12.3 Java 内 存 模型 


Java 虚 拟 机 规范 中 试图 定义 一 种 Java 内 存 模型 (Java Memory 
Model,JMM) 来 屏蔽 掉 各 种 硬件 和 操作 系统 的 内 存 访问 差异 ， 以 实现 让 
Java 程 序 在 各 种 平台 下 都 能 达到 一 致 的 内 存 访 问 效果 。 在 此 之 前 ， 主 流 
程序 语言 (如 C/C++ 等 ) 直接 使 用 物理 硬件 和 操作 系统 的 内 存 模型 ， 因 
此 ， 会 由 于 不 同 平台 上 内 存 模型 的 差异 ， 有 可 能 导致 程序 在 一 套 平台 上 
并 发 完全 正常 ， 而 在 男 外 一 套 平 台 上 并 发 访问 却 经 常 出 错 ， 因 此 在 某 些 
场景 就 必须 针对 不 同 的 平台 来 编写 程序 。 











定义 Java 内 存 模 型 并 非 一 件 容易 的 事情 ， 这 个 模型 必须 定义 得 足够 
严谨 ， 才 能 让 Java 的 并 发 内 存 访问 操作 不 会 产生 歧义 ; 但是， 也 必须 定 
义 得 足够 宽松 ， 使 得 虚拟 机 的 实现 有 足够 的 自由 空间 去 利用 硬件 的 各 种 
特性 《寄存 器 、 高 速 缓存 和 指令 集中 某 些 特有 的 指令 ) 来 获取 更 好 的 执 
行 速度 。 经 过 长 时 间 的 验证 和 修补 ， 在 JDK 1.5〈 实 现 了 JSR-133) 发 
布 后 ，Java 内 存 模型 已 经 成 熟 和 完善 起 来 了 。 








12.3.1 主 内 存 与 工作 内 存 


Java 内 存 模型 的 主要 目标 是 定义 程序 中 各 个 变量 的 访问 规则 ， 即 在 
虚拟 机 中 将 变量 存储 到 内 存 和 从 内 存 中 取出 变量 这 样 的 撒 层 细节 。 此 处 





的 变量 《Variables) 与 Java 编 程 中 所 说 的 变量 有 所 区 别 ， 它 包括 了 实例 
字段 、 静 态 字 段 和 构成 数组 对 象 的 元 素 ， 但 不 包括 局 部 变量 与 方法 参 
数 ， 因 为 后 者 是 线程 私有 的 中 ， 不 会 被 共享 ， 自 然 就 不 会 存在 竞争 问 
题 。 为 了 获得 较 好 的 执行 效能 ，Java 内 存 模 型 并 没有 限制 执行 引擎 使 用 
处 理 占 的 特定 寄存 器 或 缓存 来 和 主 内 存 进行 交互 ， 也 没有 限制 即时 编译 
融 进 行 调整 代码 执行 顺序 这 类 优化 措施 。 














Java 内 存 模型 规定 了 所 有 的 变量 都 存储 在 主 内 存 (Main Memory ) 
中 《此 处 的 主 内 存 与 介绍 物理 硬件 时 的 主 内 存 名 字 一 样 ， 两 者 也 可 以 互 
相 类 比 ， 但 此 处 仅 是 虚拟 机 内 存 的 一 部 分 ) 。 每 条 线程 还 有 自己 的 工作 
内 存 (Working Memory， 可 与 前 面 讲 的 处 理 器 高 速 缓存 类 比 ) ， 线 程 
的 工作 内 存 中 保存 了 被 该 线程 使 用 到 的 变量 的 主 内 存 副 本 拷贝 四， 线程 
对 变量 的 所 有 操作 〈 读 取 、 赋 值 等 ) 都 必须 在 工作 内 存 中 进行 ， 而 不 能 
直接 读 写 主 内 存 中 的 变量 54。 不 同 的 线程 之 间 也 无 法 直接 访问 对 方 工作 
内 存 中 的 变量 ， 线 程 间 变量 值 的 传递 均 需 要 通过 主 内 存 来 完成 ， 线 程 、 
主 内 存 、 工 作 内 存 三 者 的 交互 关系 如 图 12-2 所 示 。 




















这 里 所 讲 的 主 内 存 、 工 作 内 存 与 本 书 第 2 草 所 讲 的 Java 内 存 区 域 中 
的 Java 堆 、 栈 、 方 法 区 等 并 不 是 同一 个 层次 的 内 存 划分 ， 这 两 者 基本 上 
是 没有 关系 的 ， 如 果 两 者 一 定 要 勉强 对 应 起 来 ， 那 从 变量 、 主 内 存 、 工 
作 内 存 的 定义 来 看 ， 主 内 存 主要 对 应 于 Java 扒 中 的 对 象 实例 数据 部 
分 5 ， 而 工作 内 存 则 对 应 于 虚拟 机 栈 中 的 部 分 区 域 。 从 更 低层 次 上 说 ， 














主 内 存 就 直接 对 应 于 物理 硬件 的 内 存 ， 而 为 了 获取 更 好 的 运行 速度 ， 虚 
拟 机 (其 至 是 硬件 系统 本 身 的 优化 措施 ) 可 能 会 让 工作 内 存 优先 存储 于 
寄存 器 和 高 速 缓存 中 ， 因 为 程序 运行 时 主要 访问 读 写 的 是 工作 内 存 。 











图 12-2 线程 、 主 内 存 、 工 作 内 存 三 者 的 交互 关系 (请 与 图 12-1 对 
比 ) 

[1 本 书 中 的 Java 内 存 模 型 都 特 指 目前 正在 使 用 的 ， 即 在 JDK 1.2 之 后 建立 
起 来 并 在 JDK 1.5 中 完备 过 的 内 存 模型 。 
DJUJSR-133: Java Memory Model and Thread Specification Revision (Java 内 存 
模型 和 线程 规范 修订 ) 。 
[3] 此 处 请 读者 注意 区 分 概念 : 如 果 局 部 变量 是 一 个 reference 类 型 ， 它 引 
用 的 对 象 在 Java 堆 中 可 被 各 个 线程 共享 ,但 是 reference 本 身 在 Java 栈 的 局 
部 变量 表 中 ， 它 是 线程 私有 的 。 

加 有 不 少 读者 会 对 这 段 描述 中 的 “拷贝 副本 ”提出 疑问 ， 如 “假设 线程 
中 访问 一 个 10MB 的 对 象 ， 也 会 把 这 10MB 的 内 存 复 制 一 份 拷贝 出 来 
吗 ? ”， 事 实 上 并 不 会 如 此 ， 这 个 对 象 的 引用 、 对 象 中 某 个 在 线程 访问 


到 的 字段 是 有 可 能 存在 拷贝 的 ， 但 不 会 有 虚拟 机 实现 成 把 整个 对 象 拷贝 
A 一 次 。 
[5 根据 Java 虚 拟 机 规范 的 规定 ，volatile 变 量 依 然 有 工作 内 存 的 拷贝 ， 但 
是 由 于 它 特殊 的 操作 顺序 性 规定 (后 文 会 讲 到 ) ， 所 以 看 起 来 如 同 直接 
在 主 内 存 中 读 写 访问 一 般 ， 因 此 这 里 的 描述 对 于 volatile 也 并 不 存在 例 
外 。 
[0 除了 实例 数据 ，Java 扒 还 保存 了 对 象 的 其 他 信息 ， 对 于 HotSpot 虚 拟 机 
来 讲 ， 有 Mark Word (存储 对 象 哈 布 码 、GC 标 志 、GC 年 龄 、 同 步 锁 等 
言 息 ) 、Klass Point (指向 存储 类 型 元 数据 的 指针 ) 及 一 些 用 于 字 节 对 
齐 补 白 的 填充 数据 〈 如 果实 例 数 据 刚好 满足 8 字 节 对 齐 的 话 ， 则 可 以 不 
存在 补 白 ) 。 


12.3.2” ”内存 间 交互 操作 


关于 主 内 存 与 工作 内 存 之 间 具 体 的 交互 协议 ， 即 一 个 变量 如 何 从 主 
内 存 拷贝 到 工作 内 存 、 如 何 从 工作 内 存 同步 回 主 内 存 之 类 的 实现 细 记 ， 
Java 内 存 模型 中 定义 了 以 下 8 种 操作 来 完成 ， 虚 拟 机 实现 时 必须 保证 下 
面 提 及 的 每 一 种 操作 都 是 原子 的 、 不 可 再 分 的 (对 于 double 和 long 类 型 
的 变量 来 说 ，load、store、read 和 write 操作 在 某 些 平台 上 人 允许 有 例外 ， 


这 个 问题 在 12.3.4 节 再 讲 ) 1。 





lock《〈 锁 定 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 标识 为 一 条 线 
程 独占 的 状态 。 


unlock《〈 解 锁 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 处 于 锁定 状态 的 
变量 释放 出 来 ， 释 放 后 的 变量 才 可 以 被 其 他 线程 锁定 。 

read 读 取 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 的 值 从 主 内 存 
传输 到 线程 的 工作 内 存 中 ， 以 便 随后 的 load 动 作 使 用 。 


load 〈 载 入 ) : 作用 于 工作 内 存 的 变量 ， 它 把 read 操 作 从 主 内 存 中 
得 到 的 变量 值 放 入 工作 内 存 的 变量 副本 中 。 


use (使 用 ) : 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 
的 值 传递 给 执行 引擎 ， 每 当 虚 拟 机 遇 到 一 个 需要 使 用 到 变量 的 值 的 字 节 


码 指 令 时 将 会 执行 这 个 操作 。 





assign 《赋值 ) : 作用 于 工作 内 存 的 变量 ， 它 把 一 个 从 执行 引擎 接 
收 到 的 值 赋 给 工作 内 存 的 变量 ， 每 当 虚 拟 机 遇 到 一 个 给 变量 赋值 的 字 人 区 
码 指 令 时 执行 这 个 操作 。 








store《〈 存 储 ) : 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 
的 值 传送 到 主 内 存 中 ， 以 便 随 后 的 write 操 作 使 用 。 





write( 写 入 ) : 作用 于 主 内 存 的 变量 ， 它 把 store 操 作 从 工作 内 存 中 
得 到 的 变量 的 值 放 入 主 内 存 的 变量 中 。 





如 果 要 把 一 个 变量 从 主 内 存 复 制 到 工作 内 存 ， 那 就 要 顺序 地 执行 
read 和 1load 操 作 ， 如 果 要 把 变量 从 工作 内 存 同步 回 主 内 存 ， 就 要 顺序 地 
执行 store 和 write 操作 。 注 意 ，Java 内 存 模型 只 要 求 上 述 两 个 操作 必须 按 
顺序 执行 ， 而 没有 保证 是 连续 执行 。 也 就 是 说 ，read 与 load 之 间 、store 
与 write 之 间 是 可 插入 其 他 指令 的 ， 如 对 主 内 存 中 的 变量 a、b 进 行 访问 
时 ， 一 种 可 能 出 现 顺 序 是 read a、readb、loadb、load a。 除 此 之 外 ， 
Java 内 存 模型 还 规定 了 在 执行 上 述 8 种 基本 操作 时 必须 满足 如 下 规则 : 





不 允许 read 和 load、store 和 write 操作 之 一 单独 出 现 ， 即 不 允许 一 个 
变量 从 主 内 存 读 取 了 但 工作 内 存 不 接受 ， 或 者 从 工作 内 存 发 起 回 写 了 但 
主 内 存 不 接受 的 情况 出 现 。 








不 允许 一 个 线程 丢弃 它 的 最 近 的 assign 操 作 ， 即 变量 在 工作 内 存 中 
改变 了 之 后 必须 把 该 变化 同步 回 主 内 存 。 


不 允许 一 个 线程 无 原因 地 (没有 友 生 过 任何 assign 操 作 〉 把 数据 从 
线程 的 工作 内 存 同 步 回 主 内 存 中 。 


一 个 新 的 变量 只 能 在 主 内 存 中 “诞生 ”， 不 允许 在 工作 内 存 中 直接 使 
用 一 个 未 被 初始 化 〈load 或 assign) 的 变量 ， 换 句 话 说 ， 就 是 对 一 个 变 
量 实施 use、store 操 作 之 前 ， 必 须 先 执 行 过 了 assign 和 1]oad 操 作 。 


一 个 变量 在 同一 个 时 刻 只 允许 一 条 线程 对 其 进行 lock 操 作 ， 但 lock 


操作 可 以 被 同一 条 线程 重复 执行 多 次 ， 多 次 执行 lock 后 ， 只 有 执行 相同 
次 数 的 unlock 操 作 ， 变 量 才 会 家 解锁 。 





如 末 对 一 个 变量 执行 lock 操 作 ， 那 将 会 清空 工作 内 存 中 此 变量 的 
值 ， 在 执行 引擎 使 用 这 个 变量 前 ， 需 要 重新 执行 1oad 或 assign 操 作 初 始 
化 变量 的 值 。 











如 果 一 个 变量 事先 没有 被 lock 操 作 锁 定 ， 那 束 不 允许 对 它 执 行 
unlock 操 作 ， 也 不 允许 去 unlock 一 个 被 其 他 线程 锁定 住 的 变量 。 


对 一 个 变量 执行 unlock 操 作 之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 中 


(执行 store、write 操 作 ) 。 


这 8 种 内 存 访问 操作 以 及 上 述 规则 限定 ， 再 加 上 稍 后 介绍 的 对 


volatile 的 一 些 特殊 规定 ， 就 已 经 完全 确定 了 Java 程 序 中 哪些 内 存 访问 操 
作 在 并 发 下 是 安全 的 。 由 于 这 种 定义 相当 严谨 但 又 十 分 烦琐 ， 实 践 起 来 
很 麻烦 ， 所 以 在 12.3.6 市 中 笔者 将 介绍 这 种 定义 的 一 个 等 效 判 断 原 则 
一 一 先行 发 生 原则 ， 用 来 确定 一 个 访问 在 并 发 环境 下 是 否 安全 。 





[1 基于 理解 难度 和 严谨 性 考虑 ， 最 新 的 JSR-133 文 档 中 ， 已 经 放弃 采用 这 
8 种 操作 去 定义 Java 内 存 模 型 的 访问 协议 了 ( 仅 是 描述 方式 改变 了 ，Java 
内 存 模型 并 没有 改变 ) 。 


12.3.3 ”对 于 volatile 型 变量 的 特殊 规则 


关键 字 volatile 可 以 说 是 Java 虚 拟 机 提供 的 最 轻 量 级 的 同步 机 制 ， 但 
是 它 并 不 容易 完全 被 正确 、 完 整地 理解 ， 以 至 于 许多 程序 员 都 习惯 不 去 
使 用 它 ， 过 到 需要 处 理 多 线程 数据 苋 争 问题 的 时 候 一 律 使 用 
synchronized 来 进行 同步 。 了 解 volatile 变 量 的 语义 对 后 面 了 解 多 线程 操 
作 的 其 他 特性 很 有 意义 ， 在 本 节 中 我 们 将 多 花 绍 一 些 时 间 去 弄 清楚 
volatile 的 语义 到 抵 是 什么 。 


Java 内 存 模 型 对 volatile 专 门 定义 了 一 些 特殊 的 访问 规则 ， 在 介绍 这 
些 比 较 折 口 的 规则 定义 之 前 ， 笔 者 先 用 不 那么 正式 但 通俗 易 懂 的 语言 来 
介绍 一 下 这 个 关键 字 的 作用 。 


当 一 个 变量 定义 为 volatile 之 后 ， 它 将 具备 两 种 特性 ， 第 一 是 保证 此 
变量 对 所 有 线程 的 可 见 性 ， 这 里 的 “可 见 性 ?是 指 当 一 条 线程 修改 了 这 个 
变量 的 值 ， 新 值 对 于 其 他 线程 来 说 是 可 以 立即 得 知 的 。 而 普通 变量 不 能 
做 到 这 一 点 ， 普 通 变 量 的 值 在 线程 间 传 递 均 需 要 通过 主 内 存 来 完成 ， 例 
如 ， 线 程 A 修改 一 个 普通 变量 的 值 ， 然 后 向 主 内 存 进 行 回 写 ， 男 外 一 条 
线程 B 在 线程 A 回 写 完 成 了 之 后 再 从 主 内 存 进行 读 取 操作 ， 新 变量 值 才 
会 对 线程 B 可 见 。 











关于 volatile 变 量 的 可 见 性 ， 经 常会 饮 开 友人 员 误 解 ， 认 为 以 下 搬 述 


成 立 : “volatile 变 量 对 所 有 线程 是 立即 可 见 的 ， 对 volatile 变 量 所 有 的 号 
操作 都 能 立刻 反应 到 其 他 线程 之 中 ， 换 句 话说 ，volatile 变 量 在 各 个 线程 
中 是 一 致 的 ， 所 以 基于 volatile 变 量 的 运算 在 并 发 下 是 安全 的 ”。 这 人 句 话 
的 论据 部 分 并 没有 错 ， 但 是 其 论据 并 不 能 得 出 “基于 volatile 变 量 的 运算 
在 并 发 下 是 安全 的 ”这 个 结论 。volatile 变 量 在 各 个 线程 的 工作 内 存 中 不 
存在 一 致 性 问题 “在 各 个 线程 的 工作 内 存 中 ，volatile 变 量 也 可 以 存在 不 
一 致 的 情况 ， 但 由 于 每 次 使 用 之 前 都 要 先 刷 新 ， 执 行 引擎 看 不 到 不 一 至 
的 情况 ， 因 此 可 以 认为 不 存在 一 致 性 问题 )》 ， 但 是 Java 里 面 的 运算 并 非 
原子 操作 ， 导 致 volatile 变 量 的 运算 在 并 发 下 一 样 是 不 安全 的 ， 我 们 可 以 
通过 一 段 简单 的 演示 来 说 明 原 因 ， 请 看 代码 清单 12-1 中 演示 的 例子 。 




















代码 清单 12-1 volatile 的 运算 





/** 
x*vVvolatile 变 量 自 增 运算 测试 


大 








xQ@author zzm 

wy 

public class VolatileTest{ 

public static volatile int race=0; 

public static void increase() { 

racett+t; 

} 

private static final int THREADS COUNT=20; 
public static void main (String[]args) 1 
Thread[]threads=new Thread [THREADS COUNT]; 
for (int i=0; i<THREADS COUNT; i++) { 
threads[i]=new Thread (new Runnable() { 
QOverride 

public void run() { 

for (int i=0; i<10000; i++) { 

increase (); 


} 



























































} 

}) ; 

threads[i].start(); 

} 

/ /等 等 所 有 累加 线程 都 结 

while (Thread.activeCount ()>1) 
Thread.yield (); 
System.out.printin (race) ; 

} 

} 














这 段 代码 发 起 了 20 个 线程 ， 每 个 线程 对 race 变 量 进行 10000 次 目 增 操 
作 ， 如 果 这 上 段 代 码 能 够 正确 并 及 的 话 ， 最 后 输出 的 结果 应 该 是 200000。 
读者 运行 完 这 段 代 码 之 后 ， 并 不 会 获得 期 望 的 结果 ， 而 且 会 发 现 每 次 运 
行程 序 ， 输 出 的 结果 都 不 一 样 ， 都 是 一 个 小 于 200000 的 数字 ， 这 是 为 什 


入 呢 ? 





问题 就 出 现在 自 增 运算 "race++" 之 中 ， 我 们 用 Javap 反 编译 这 段 代码 
百 会 得 到 代码 清单 12-2， 发 现 只 有 一 行 代码 的 crease() 方 法 在 Class 文 件 
中 是 由 4 条 字 节 码 指令 构成 的 〈return 指 令 不 是 由 race++ 产 生 的 ， 这 条 指 
令 可 以 不 计算 ) ， 从 字 节 码 层 面 上 很 容易 就 分 析出 并 发 失败 的 原因 了 : 
当 getstatic 指 令 把 race 的 值 取 到 操作 栈 顶 时 ，volatile 关 键 字 保证 了 race 的 
值 在 此 时 是 正确 的 ， 但 是 在 执行 iconst_1、iadd 这 些 指令 的 时 候 ， 其 他 线 
程 可 能 已 经 把 race 的 值 加 大 了 ， 而 在 操作 栈 顶 的 值 就 变 成 了 过 期 的 数 
据 ， 所 以 putstatic 指 令 执行 后 就 可 能 把 较 小 的 race 值 同步 回 主 内 存 之 中 。 








代码 清单 12-2 VolatileTest 的 字 节 三 








public static void increase () ; 
Code: 

Stack=2, Locals=0, Args size=0 
O:getstatic#13; //Field race:I 
3:1e0nst 1 
4:iadd 
5:putstatic#13; //Field race:I 
8:return 

LineNumberTable: 

line 14:0 

line 15:8 


















































客观 地 说 ， 笔 者 在 此 使 用 字 节 码 来 分 析 并 发 问题 ， 仍 然 是 不 严谨 
的 ， 因 为 即使 编译 出 来 只 有 一 条 字 节 码 指令 ， 也 并 不 意味 执行 这 条 指令 
就 是 一 个 原子 操作 。 一 条 字 节 码 指令 在 解释 执行 时 ， 解 释 右 将 要 运行 许 
多 行 代码 才能 实现 它 的 语义 ， 如 果 是 编译 执行 ， 一 条 字 市 码 指令 也 可 能 
转化 成 看 干 条 本 地 机 需 码 指令 ， 此 处 使 用 -XX:+PrintAssembly 参 数 得 出 
反 汇 纺 来 分 析 会 更 加 严谨 一 些 ， 但 考 碟 到 读者 阅读 的 方便 ， 并 且 字 贡 码 
己 经 能 说 明 问 题 ， 所 以 此 处 使 用 字 节 码 来 分 析 。 











由 于 volatile 变 量 只 能 保证 可 见 性 ， 在 不 符合 以 下 两 条 规则 的 运算 场 
景 中 ， 我 们 仍然 要 通过 加 锁 (使 用 synchronized 或 java.util.concurrent 中 的 
原子 类 ) 来 保证 原子 性 。 


运算 结果 并 不 依赖 变量 的 当前 值 ， 或 者 能 够 确保 只 有 单一 的 线程 修 
改变 量 的 值 。 








进 


量 不 需要 与 其 他 的 状态 变量 共同 参与 不 变 约束 。 





而 在 像 如 下 的 代码 清单 12-3 所 示 的 这 类 场景 就 很 适合 使 用 volatile 变 
量 来 控制 并 发 ， 当 shutdown0 方 法 被 调用 时 ， 能 保证 所 有 线程 中 执行 的 
doWork() 方 法 都 立即 停 下 来 。 


代码 清单 12-3 volatile 的 使 用 场景 


volatile boolean shutdownRequested:; 
public void shutaown () { 
shutdownRequested=true; 

} 

public void doWork(){ 

while (!shutdownRequested) { 

//do stuff 
} 

} 























使 用 volatile 变 量 的 第 二 个 语义 是 禁止 指令 重 排序 优化 ， 普 通 的 变量 
仅仅 会 保证 在 该 方法 的 执行 过 程 中 所 有 依赖 赋值 结果 的 地 方 都 能 获取 到 
正确 的 结果 ， 而 不 能 保证 变量 赋值 操作 的 顺序 与 程序 代码 中 的 执行 顺序 
一 致 。 因 为 在 一 个 线程 的 方法 执行 过 程 中 无 法 感知 到 这 点 ， 这 也 就是 
Java 内 存 模型 中 描述 的 所 谓 的 “线程 内 表现 为 串 行 的 语义 ”(Within- 


Thread As-If-Serial Semantics) 。 











上 面 的 描述 仍然 不 太 容 易 理 解 ， 我 们 还 是 继续 通过 一 个 例子 来 看 看 
为 何 指令 重 排序 会 干扰 程序 的 并 发 执行 ， 泪 示 程 序 如 代码 清单 12-4 所 


钞 。 


代码 清单 12-4 指令 重 排序 








Map configOptions; 

char[]configText; 

// 此 变量 必须 定义 为 volatile 

volatile boolean initialized=false:; 

// 假 设 以 下 代码 在 线程 A 中 执行 

// 模 拟 读 取 配 置信 息 ， 当 读 取 完成 后 将 initialized 设 置 为 true 以 通知 其 他 线程 配置 可 























configOptions=new HashMap (); 
configText=readConfigFile (fileName); 
processConfigOptions (configText,configOptions); 
initialized=true; 

/ /假设 以 下 代码 在 线程 B 中 执行 

/ /等待 jnitialized 为 true， 代 表 线 程 A 已 经 把 配置 信息 初始 化 完成 
while (!initialized) { 

sleep () ; 



































} 
/ /使 用 线程 A 中 初始 化 好 的 配置 信息 
doSomethingWithConfig () ; 











代码 清 蛙 12-4 中 的 程序 是 一 段 伪 代码 ， 其 中 描述 的 场景 十 分 常见 ， 

只 是 我 们 在 处 理 配 置 文件 时 一 般 不 会 出 现 并 发 而 已 。 如 果 定 义 initialized 
变量 时 没有 使 用 volatile 修 饰 ， 就 可 能 会 由 于 指令 重 排 序 的 优化 ， 导 致 位 
于 线程 A 中 最 后 一 句 的 代码 "initialized=true" 被 提前 执行 (这 里 虽然 使 用 
Java 作 为 伪 代 码 ， 但 所 指 的 重 排序 优化 是 机 器 级 的 优化 操作 ， 提 前 执行 
是 指 这 句 话 对 应 的 汇编 代码 被 提前 执行 ) ， 这 样 在 线程 B 中 使 用 配置 信 
奶 的 代码 就 可 能 出 现 错 误 ， 而 volatile 关 键 字 则 可 以 避免 此 类 情况 的 及 

生 [1。 











指令 重 排序 是 并 发 编程 中 最 容易 让 开发 人 员 产 生 疑 惑 的 地 方 ， 除 了 
上 上面 伪 代码 的 例子 之 外 ， 笔 者 再 举 一 个 可 以 实际 操作 运行 的 例子 来 分 析 
volatile 关 键 字 是 如 何 禁 止 指 令 重 排序 优化 的 。 代 码 清单 12-5 古 一 段 标准 





的 DCL 单 例 代 码 ， 可 以 观察 加 入 volatile 和 未 加 入 volatile 关 键 字 时 所 生成 
汇编 代码 的 差别 (如 何 获 得 JIT 的 汇编 代码 ， 请 参考 4.2.7 节 ) 。 


代码 清单 12-5 DCL 单 例 模式 





public class Singleton{ 
private volatile static Singleton instance; 
public static Singleton getInstance () { 




















if (instance==null) 1 
synchronized (Singleton.class) 1 











if (instan 








ce==null1) { 





instance=new Singleton () ; 


} 
} 
} 


return instance:; 


} 








public static void main (String[]args) 1 


Singleton. 
} 











detInstance () ; 

















编译 后 ， 这 段 代 码 对 instance 变 量 赋值 部 分 如 代码 清单 12-6 所 示 。 
代码 清单 12-6 
Ox0la3de0f:mov$0x3375cdb0, Sesi; ...... beb0cd75 33 
; {oop ('Singleton')} 
Ox01la3del4:mov%eax, Ox150 (%esi) ; ..... 89865001 0000 
Ox0la3dela:shr$0x9, Sesi; ...... clee09 
Ox0la3deld:movb$0x0, Ox1104800 (%esi) ; ..... c6860048 100100 
Ox01la3de24:lock addl$0x0, (%esp) ; .….E0830424 00 








; *putstatic instance 


Singleton: 





getInstance@24 





通过 对 比 就 会 发 现 ， 关 键 变 化 在 于 有 volatile 修 饰 的 变量 ， 赋 值 后 


(前 面 mov%eax，0x150 (%esi) 这 句 便 是 赋值 操作 ) 多 执行 了 一 

个 "lock addl $ 0x0，〔%esp) ”操作 ， 这 个 操作 相当 于 一 个 内 存 屏障 
(Memory Barrier 或 Memory Fence， 指 重 排序 时 不 能 把 后 面 的 指令 重 排 
序 到 内 存 屏 障 之 前 的 位 置 )》 ， 只 有 一 个 CPU 访问 内 存 时 ， 并 不 需要 内 存 
屏障 ; 但 如 果 有 两 个 或 更 多 CPU 访问 同一 块 内 存 ， 且 其 中 有 一 个 在 观测 
另 一 个 ， 就 需要 内 存 屏障 来 保证 一 致 性 了 。 这 人 句 指 令 中 的 “addl $ 0x0， 
(%esp) ”( 把 ESP 寄 存 器 的 值 加 0) 显然 是 一 个 空 操 作 〈 采 用 这 个 空 操 
作 而 不 是 空 操作 指令 nop 是 因为 IA32 手 册 规 定 lock 前 绥 不 允许 配合 nop 指 
令 使 用 ) ， 关 键 在 于 lock 前 级 ， 查 询 IA32 手 册 ， 它 的 作用 是 使 得 本 CPU 
的 Cache 写 入 了 内 存 ， 该 写 入 动作 也 会 引起 别 的 CPU 或 者 别 的 内 核 无 效 
化 《Invalidate) 其 Cache， 这 种 操作 相当 于 对 Cache 中 的 变量 做 了 一 次 前 
面 介 绍 Java 内 存 模式 中 所 说 的 “store 和 write” 操 作 21。 所 以 通过 这 样 一 个 
空 操作 ， 可 让 前 面 volatile 变 量 的 修改 对 其 他 CPU 立即 可 见 。 








那 为 何 说 它 茶 止 指令 重 排序 呢 ? 从 硬件 架构 上 讲 ， 指 令 重 排序 是 指 
CPU 采用 了 允许 将 多 条 指令 不 按 程 序 规定 的 顺序 分 开发 送 给 各 相应 电路 
单元 处 理 。 但 并 不 是 说 指令 任意 重 排 ，CPU 需 要 能 正确 处 理 指令 依赖 情 
况 以 保障 程序 能 得 出 正确 的 执行 结果 。 壁 如 指令 1 把 地 址 A 中 的 值 加 
10， 指 令 2 把 地 址 A 中 的 值 乘 以 2， 指 令 3 把 地 址 B 中 的 值 减 去 3， 这 时 指 
令 1 和 指令 2 是 有 依赖 的 ， 它 们 之 间 的 顺序 不 能 重 排 一 一 〈A+10) *2 与 
A*2+10 显 然 不 相等 ， 但 指令 3 可 以 重 排 到 指令 1、2 之 前 或 者 中 间 ， 只 要 
保证 CPU 执行 后 面 依赖 到 A、B 值 的 操作 时 能 获取 到 正确 的 A 和 B 值 即 














可 。 上 所 以 在 本 内 CPU 中 ， 重 排序 看 起 来 依然 是 有 序 的 。 因 此 ，lock addl 
$0x0，《〈9%esp) 指令 把 修改 同步 到 内 存 时 ， 意 味 着 所 有 之 前 的 操作 都 
己 经 执行 完成 ， 这 样 便 形成 了 “指令 重 排序 无 法 越过 内 存 屏 障 ” 的 效果 。 





解决 了 volatile 的 语义 问题 ， 再 来 看 看 在 众多 保障 并 发 安全 的 工具 中 
选用 volatile 的 意义 一 一 它 能 让 我 们 的 代码 比 使 用 其 他 的 同步 工具 更 快 
吗 ? 在 某 些 情况 下 ，volatile 的 同步 机 制 的 性 能 确实 要 优 于 锁 使 用 
synchronized 关 键 字 或 javautiLconcurrent 包 里 面 的 锁 ) ， 但 是 由 于 虚拟 机 
对 锁 实 行 的 许多 消除 和 优化 ， 使 得 我 们 很 难 量化 地 认为 volatile 就 会 比 
synchronized 快 多 少 。 如 果 让 volatile 自 己 与 自己 比较 ， 那 可 以 确定 一 个 
原则 ，volatile 变 量 读 操作 的 性 能 消耗 与 普通 变量 几乎 没有 什么 差别 ， 但 
是 写 操作 则 可 能 会 慢 一 些 ， 因 为 它 需要 在 本 地 代码 中 插入 许多 内 存 屏障 
指令 来 保证 处 理 器 不 发 生 乱 序 执行 。 不 过 即便 如 此 ， 大 多 数 场景 下 
volatile 的 总 开销 仍然 要 比 锁 低 ， 我 们 在 volatile 与 锁 之 中 选择 的 唯一 依据 
仅仅 是 volatile 的 语义 能 否 满足 使 用 场景 的 需求 。 


在 本 节 的 最 后 ， 我 们 回头 看 一 下 Java 内 存 模 型 中 对 volatile 变 量 定义 
的 特殊 规则 。 假 定 IT 表示 一 个 线程 ，V 和 W 分 别 表示 两 个 volatile 型 变 
量 ， 那 么 在 进行 read、load、use、assign、store 和 write 操作 时 需要 满足 
如 下 规则 : 





只 有 当 线 程 TI 对 变量 V 执 行 的 前 一 个 动作 是 load 的 时 候 ， 线 程 T 才 能 
对 变量 V 执 行 use 动 作 ， 并 且 ， 只 有 当 线 程 T 对 变量 V 执 行 的 后 一 个 动作 





是 use 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 load 动 作 。 线 程 T 对 变量 V 的 use 动 
作 可 以 认为 是 和 线程 T 对 变量 V 的 load、read 动 作 相 关联 ， 必 须 连续 一 起 
出 现 〈 这 条 规则 要 求 在 工作 内 存 中 ， 每 次 使 用 V 前 都 必须 先 从 主 内 存 刷 
新 最 新 的 值 ， 用 于 保证 能 看 见 其 他 线程 对 变量 V 所 做 的 修改 后 的 值 ) 。 





只 有 当 线 程 T 对 变量 V 执 行 的 前 一 个 动作 是 assign 的 时 候 ， 线 程 T 才 
能 对 变量 V 执 行 store 动 作 ; 并 且 ， 只 有 当 线 程 T 对 变量 V 执 行 的 后 一 个 动 
作 是 store 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 assign 动 作 。 线 程 T 对 变量 V 的 
assign 动 作 可 以 认为 是 和 线程 T 对 变量 V 的 store、write 动 作 相 关联 ， 必 须 
连续 一 起 出 现 《〈 这 条 规则 要 求 在 工作 内 存 中 ， 每 次 修改 V 后 都 必须 立刻 
同步 回 主 内 存 中 ， 用 于 保证 其 他 线程 可 以 看 到 自己 对 变量 V 所 做 的 修 
改 》 3 





假定 动作 A 是 线程 T 对 变量 V 实 施 的 use 或 assign 动 作 ， 假 定 动作 F 是 
和 动作 A 相关 联 的 load 或 store 动 作 ， 假 定 动 作 P 是 和 动作 F 相 应 的 对 变量 
V 的 read 或 write 动 作 ; 类 似 的 ， 假 定 动 作 B 是 线程 T 对 变量 W 实 施 的 use 或 
assign 动 作 ， 假 定 动作 G 是 和 动作 B 相 关联 的 load 或 store 动 作 ， 假 定 动作 
Q 是 和 动作 G 相 应 的 对 变量 W 的 read 或 write 动作 。 如 果 A 先 于 B， 那 么 P 先 
于 Q《〈 这 条 规则 要 求 volatile 修 饰 的 变量 不 会 被 指令 重 排序 优化 ， 保 证 代 
码 的 执行 顺序 与 程序 的 顺序 相同 ) 。 


[volatile 屏 项 指令 重 排序 的 语义 在 JDK 1.5 中 才 被 完全 修复 ， 此 前 的 JDK 
中 即使 将 变量 声明 为 volatile 也 仍然 不 能 完全 避免 重 排 序 所 导致 的 问题 


(主要 是 volatile 变 量 前 后 的 代码 仍然 存在 重 排序 问题 ) ， 这 点 也 是 在 
JDK 1.5 之 前 的 Java 中 无 法 安全 地 使 用 DCL ( 双 锁 检测 ) 来 实现 单 例 模式 
的 原因 。 

(2Doug Lea 列 出 了 各 种 处 理 器 架构 下 的 内 存 屏障 指令 
http://g.oswego.edu/ dl/jmm/cookbook.html。 


12.3.4 ”对 于 long 和 double 型 变量 的 特殊 规则 


Java 内 存 模型 要 求 lock、unlock、read、load、assign、use、store、 
write 这 8 个 操作 都 具有 原子 性 ， 但 是 对 于 64 位 的 数据 类 型 (Jong 和 
double) ， 在 模型 中 特别 定义 了 一 条 相对 宽松 的 规定 : 允许 虚拟 机 将 没 
有 被 volatile 修 饰 的 64 位 数据 的 读 写 操作 划分 为 两 次 32 位 的 操作 来 进行 ， 
即 允 许 虚 拟 机 实现 选择 可 以 不 保证 64 位 数据 类 型 的 load、store、read 和 
write 这 4 个 操作 的 原子 性 ， 这 点 就 是 所 谓 的 long 和 double 的 非 原子 性 协定 








(Nonatomic Treatment ofdouble and long Variables) 。 
如 果 有 多 个 线程 共享 一 个 并 未 声明 为 volatile 的 long 或 double 类 型 的 


变量 ， 并 且 同 时 对 它们 进行 读 取 和 修改 操作 ， 那 么 茶 些 线程 可 能 会 读 取 
到 一 个 既 非 原 值 ， 也 不 是 其 他 线程 修改 值 的 代表 了 “ 半 个 变量 ”的 数值 。 





不 过 这 种 读 取 到 “ 半 个 变量 ”的 情况 非常 罕见 (在 目前 商用 Java 虚 拟 
机 中 不 会 出 现 ) ， 因 为 Java 内 存 模型 虽然 允许 虚拟 机 不 把 long 和 double 
变量 的 读 写实 现成 原子 操作 ， 但 允许 虚拟 机 选择 把 这 些 操作 实现 为 具有 
原子 性 的 操作 ， 而 且 还 “强烈 建议 ?虚拟 机 这 样 实现 。 在 实际 开发 中 ， 目 
前 各 种 平台 下 的 商用 虚拟 机 几乎 都 选择 把 64 位 数据 的 读 写 操作 作为 原子 
操作 来 对 待 ， 因 此 我 们 在 编写 代码 时 一 般 不 需要 把 用 到 的 long 和 double 
变量 专门 声明 为 volatile。 








12.3.5 原子 性 、 可 见 性 与 有 序 性 


介绍 完 Java 内 存 模型 的 相关 操作 和 规则 ， 我 们 再 整体 回顾 一 下 这 
模型 的 特征 。Java 内 存 模型 是 围绕 着 在 并 发 过 程 中 如 何 处 理 原子 性 、 可 
见 性 和 有 序 性 这 3 个 特征 来 建立 的 ， 我 们 逐个 来 看 一 下 哪些 操作 实现 了 
区 3 人 生性。 


原子 性 (Atomicity〉: 由 Java 内 存 模型 来 直接 保证 的 原子 性 变量 操 
作 包 括 read、load、assign、use、store 和 write， 我 们 大 致 可 以 认为 基本 
数据 类 型 的 访问 读 写 是 具备 原子 性 的 〈 例 外 就 是 long 和 double 的 非 原子 
性 协定 ， 读 者 只 要 知道 这 件 事情 就 可 以 了 ， 无 须 太 过 在 意 这 些 几 乎 不 会 
发 生 的 例外 情况 ) 。 

















如 果 应 用 场景 需要 一 个 更 大 范围 的 原子 性 保证 (经 第 会 遇 到 )， 
Java 内 存 模型 还 提供 了 lock 和 unlock 操 作 来 满足 这 种 需求 ， 尽 管 虚拟 机 
未 把 lock 和 unlock 操 作 和 直接 开放 给 用 户 使 用 ， 但 是 却 提 供 了 更 局 层次 的 

节 码 指令 monitorenter 和 monitorexit 来 隐 式 地 使 用 这 两 个 操作 ， 这 两 个 
字 节 人 码 指 令 反 映 到 Java 代 码 中 就 是 同步 块 一 一 synchronized 关 键 字 ， 因 此 
在 synchronized 块 之 间 的 操作 也 具备 原子 性 。 





可 见 性 (Visibility〉: 可 见 性 是 指 当 一 个 线程 修改 了 共享 变量 的 
值 ， 其 他 线程 能 够 立即 得 知 这 个 修改 。 上 文 在 讲解 volatile 变 量 的 时 候 我 


们 已 详细 讨论 过 这 一 点 。Java 内 存 模型 是 通过 在 变量 修改 后 将 新 值 同 步 
回 主 内 存 ， 在 变量 读 取 前 从 主 内 存 刷 新 变量 值 这 种 依赖 主 内 存 作为 传递 
媒介 的 方式 来 实现 可 见 性 的 ， 无 论 是 普通 变量 还 是 volatile 变 量 都 是 如 

普通 变量 与 volatile 变 量 的 区 别 是 ，volatile 的 特殊 规则 保证 了 新 值 能 
立即 同步 到 主 内 存 ， 以 及 每 次 使 用 前 立即 从 主 内 存 刷 新 。 因 此 ， 可 以 说 
volatile 保 证 了 多 线程 操作 时 变量 的 可 见 性 ， 而 普通 变量 则 不 能 保证 这 一 
i 

















除了 volatile 之 外 ，Java 还 有 两 个 关键 字 能 实现 可 见 性 ， 即 
synchronized 和 final。 同 步 块 的 可 见 性 是 由 “对 一 个 变量 执行 unlock 操 作 
之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 中 〈 执 行 store、write 操 作 ) ”这 条 
规则 获得 的 ， 而 final 关 键 字 的 可 见 性 是 指 : 被 final 修 饰 的 字段 在 构造 器 
中 一 且 初 始 化 完成 ， 并 且 构 造 器 没有 把 "this" 的 引用 传递 出 去 〈this 引 用 
逃逸 是 一 件 很 危险 的 事情 ， 其 他 线程 有 可 能 通过 这 个 引用 访问 到 “初始 
化 了 一 半 ” 的 对 象 ) ， 那 在 其 他 线程 中 就 能 看 见 final 字 段 的 值 。 如 代码 
清单 12-7 所 示 ， 变 量 i 与 j 都 具备 可 见 性 ， 它 们 无 须 同步 就 能 被 其 他 线程 
正确 访问 。 


代码 清单 12-7 final 与 可 见 性 








bublic statie final int. Ts 
public final irnt 3 
statict 

i=0; 

//do something 

} 














{ 

// 也 可 以 选择 在 构造 函数 中 初始 化 
j=0; 

//do something 

} 





有 序 性 〈Ordering) : Java 内 存 模型 的 有 序 性 在 前 面 讲解 volatile 时 
也 详细 地 讨论 过 了 ，Java 程 序 中 天 然 的 有 序 性 可 以 总 结 为 一 句 话 : 如 果 
在 本 线程 内 观察 ， 所 有 的 操作 都 是 有 序 的 ; 如果 在 一 个 线程 中 观察 男 一 
个 线程 ， 所 有 的 操作 都 是 无 序 的 。 前 半 句 是 指 “ 线 程 内 表现 为 串 行 的 语 
义 ”(Within-Thread As-If-Serial Semantics) ， 后 半 句 是 指 “ 指 令 重 排 
序 ? 现 象 和 “工作 内 存 与 主 内 存 同步 延迟 ”现象 。 





Java 语 言 提供 了 volatile 和 synchronized 两 个 关键 字 来 保证 线程 之 间 操 
作 的 有 序 性 ，volatile 关 键 字 本 身 就 包含 了 禁止 指令 重 排序 的 语义 ， 而 
synchronized 则 是 由 “一 个 变量 在 同一 个 时 刻 只 允许 一 条 线程 对 其 进行 
lock 操 作 ” 这 条 规则 获得 的 ， 这 条 规则 决定 了 持 有 同一 个 锁 的 两 个 同步 块 
只 能 串 行 地 进入 。 








介绍 完 并 发 中 3 种 重要 的 特性 后 ， 读 者 有 没有 发 现 synchronized 关 键 
字 在 需要 这 3 种 特性 的 时 候 都 可 以 作为 其 中 一 种 的 解决 方案 ?看 起 来 
很 “万 能 * 吧 。 的 确 ， 大 部 分 的 并 发 控制 操作 都 能 使 用 synchronized 来 完 
成 。synchronized 的 “万 能 ”也 间接 造就 了 它 被 程序 员 滥 用 的 局 面 ， 越 “万 
后 的 并 发 控制 ， 通 常会 伴随 着 越 大 的 性 能 影响 ， 这 点 我 们 将 在 第 13 章 
讲解 虚拟 机 锁 优化 时 再 介绍 





12.3.6 ”先行 发 生 原 则 





如 果 Java 内 存 模型 中 所 有 的 有 序 性 都 仅仅 靠 volatile 和 synchronized 来 
完成 ， 那 么 有 一 些 操作 将 会 变 得 很 烦琐 ， 但 是 我 们 在 编写 Java 并 发 代码 
的 时 候 并 没有 感觉 到 这 一 点 ， 这 是 因为 Java 语 言 中 有 一 个 “先行 发 
生 ”(happens-before) 的 原则 。 这 个 原则 非常 重要 ， 它 是 判断 数据 是 否 
存在 竞争 、 线 程 是 否 安全 的 主要 依据 ， 依 靠 这 个 原则 ， 我 们 可 以 通过 几 
条 规则 一 揽 子 地 解决 并 发 环境 下 两 个 操作 之 间 是 否 可 能 存在 冲突 的 所 有 


问题 。 














现在 就 来 看 看 “移行 发 生 ? 原 则 指 的 是 什么 。 先 行 发 生 是 Java 内 存 模 
型 中 定义 的 两 项 操作 之 间 的 偏 序 关 系 ， 如 果 说 操作 A 先行 太 生 于 操作 
B， 其 实 就 是 说 在 发 生 操 作 B 之 前 ， 操 作 A 产 生 的 影 啊 能 被 操作 B 观 察 
到 , “影响 "包括 修改 了 内 存 中 共 孚 变量 的 值 、 发 送 了 消息 、 调 用 了 方法 
等 。 这 人 句 话 不 难 理解 ， 但 它 意 味 着 什么 呢 ? 我 们 可 以 举 个 例子 来 说 明 一 
下 ， 如 代码 清单 12-8 中 所 示 的 这 3 句 伪 代码 。 











代码 清单 12-8 先行 发 生 原则 示例 1 


/ /以 下 操作 在 线程 A 中 执行 
i=1; 
// 以 下 操作 在 线程 B 中 执行 

















j=i; 
// 以 下 操作 在 线程 c 中 执行 


i=2; 





假设 线程 A 中 的 操作 "i=1" 先 行 发 生 于 线程 B 的 操作 "j=i"， 那 么 可 以 
确定 在 线程 B 的 操作 执行 后 ， 变 量 j 的 值 一 定 等 于 1， 得 出 这 个 结论 的 依 
据 有 两 个 : 一 是 根据 先行 发 生 原 则 ，"i=1" 的 结果 可 以 被 观察 到 ; 二 是 线 
程 C 还 没 “ 登 场 "， 线 程 A 操 作 结 束 之 后 没有 其 他 线程 会 修改 变量 i 的 值 。 
现在 再 来 考虑 线程 C， 我 们 依然 保持 线程 A 和 线程 B 之 间 的 先行 发 生 关 
系 ， 而 线程 C 出 现在 线程 A 和 线程 B 的 操作 之 间 ， 但 是 线程 C 与 线程 B 没 
有 先行 发 生 关 系 ， 那 j 的 值 会 是 多 少 呢 ? 答案 是 不 确定 ! 1 和 2 都 有 可 

， 因 为 线程 C 对 变量 i 的 影响 可 能 会 被 线程 B 观 察 到 ， 也 可 能 不 会 ， 

时 候 线 程 B 就 存在 读 取 到 过 期 数据 的 风险 ， 不 具备 多 线程 安全 性 。 

















下 面 是 Java 内 存 模型 下 一 些 “ 天 然 的 ”先行 及 生 关 系 ， 这 些 先行 发 生 
关系 无 须 任何 同步 占 协 助 就 已 经 存在 ， 可 以 在 编码 中 直接 使 用 。 如 果 两 
个 操作 之 间 的 关系 不 在 此 列 ， 并 且 无 法 从 下 列 规则 推导 出 来 的 话 ， 它 们 
就 没有 顺序 性 保障 ， 虚 拟 机 可 以 对 它们 随意 地 进行 重 排序 。 











程序 次 序 规则 (Program Order Rule) : 在 一 个 线程 内 ， 按 照 程序 代 
人 码 顺序 ， 书 写 在 前 面 的 操作 先行 发 生 于 书写 在 后 面 的 操作 。 准 确 地 说 ， 
应 该 是 控制 流 顺 序 而 不 是 程序 代码 顺序 ， 因 为 要 考虑 分 文 、 循 环 等 结 
构 。 


管 程 锁定 规则 (Monitor Lock Rule) : 一 个 unlock 操 作 先 行 发 生 于 
后 面 对 同 一 个 锁 的 lock 操 作 。 这 里 必须 强调 的 是 同一 个 锁 ， 而 “后 面 * 是 
指 时 间 上 的 先后 顺序 。 


volatile 变 量规 则 (Volatile Variable Rule) : 对 一 个 volatile 变 量 的 写 
操作 先行 发 生 于 后 面 对 这 个 变量 的 读 操 作 ， 这 里 的 “后 面 > 同 样 是 指 时 间 
上 的 先后 顺序 。 


线程 启动 规则 (Thread Start Rule) : Thread 对 象 的 start() 方 法 先行 
发 生 于 此 线程 的 每 一 个 动作 。 


线程 终止 规则 (Thread Termination Rule) : 线程 中 的 所 有 操作 都 先 
行 发 生 于 对 此 线程 的 终止 检测 ， 我 们 可 以 通过 Thread.join0) 方 法 结束 、 
Thread.isAlive() 的 返回 值 等 手段 检测 到 线程 已 经 终止 执行 。 


线程 中 断 规则 (Thread Interruption Rule) : 对 线程 interrupt(0) 方 法 的 
调用 先行 发 生 于 被 中 断 线程 的 代码 检测 到 中 断 事 件 的 发 生 ， 可 以 通过 
Thread.interrupted(0) 方 法 检测 到 是 否 有 中 断 发 生 。 


对 象 终结 规则 (Finalizer Rule) : 一 个 对 象 的 初始 化 完成 (构造 孙 
数 执行 结束 〉 先行 发 生 于 它 的 finalize0) 方 法 的 开始 。 

传递 性 〈Transitivity) : 如 果 操 作 A 先 行 发 生 于 操作 B， 操 作 B 先 行 
发 生 于 操作 C， 那 就 可 以 得 出 操作 A 先行 发 生 于 操作 C 的 结论 。 


Java 语 言 无 须 任何 同步 手段 保障 就 能 成 立 的 先行 发 生 规 则 就 只 有 上 
面 这 些 了 ， 笔 者 演示 一 下 如 何 使 用 这 些 规则 去 判定 操作 间 是 否 具 备 顺序 
性 ， 对 于 读 写 共 至 变量 的 操作 来 说 ， 就 是 线程 是 人 否 安全 ， 读 者 还 可 以 从 








下 面 这 个 例子 中 感受 一 下 “时 间 上 的 先后 顺序 ”与 “先行 发 生 * 之 间 有 什么 
不 同 。 演 示例 子 如 代码 清单 12-9 所 示 。 


代码 清单 12-9 ”先行 发 生 原则 示例 2 


private int value=0; 

pubilc void setValue (int value) { 
this.value=value:; 

} 

public int getValue() { 

return value:; 


} 


代码 清单 12-9 中 显示 的 是 一 组 再 普通 不 过 的 getter/setter 方 法 ， 假 设 
存在 线程 A 和 B， 线 程 A 先 (时 间 上 的 先后 调用 了 "setValue (1) "， 然 
后 线程 B 调 用 了 同一 个 对 象 的 "getValue0"， 那 么 线程 B 收 到 的 返回 值 是 
什么 ? 


我 们 依次 分 析 一 下 先行 及 生 原 则 中 的 各 项 规则 ， 由 于 两 个 方法 分 别 
由 线程 A 和 线程 B 调 用 ， 不 在 一 个 线程 中 ， 所 以 程序 次 序 规则 在 这 里 不 
适用 ; 由 于 没有 同步 块 ， 自 然 束 不 会 发 生 lock 和 unlock 操 作 ， 所 以 浓 程 
锁定 规则 不 适用 ， 由 于 value 变 量 没 有 被 volatile 关 键 字 修饰 ， 所 以 volatile 
变量 规则 不 适用 ; 后 面 的 线程 启动 、 终 止 、 中 断 规则 和 对 象 终结 规则 也 
和 这 里 完全 没有 关系 。 因 为 没有 一 个 适用 的 先行 发 生 规 则 ， 上 所 以 最 后 一 
条 传递 性 也 无 从 谈 起 ， 因 此 我 们 可 以 判定 尽管 线程 A 在 操作 时 间 上 先 于 
线程 B， 但 是 无 法 确定 线程 B 中 "getValue()" 方 法 的 返回 结果 ， 换 句 话 


说 ， 这 里 面 的 操作 不 是 线程 安全 的 。 


那 怎么 修复 这 个 问题 呢 ? 我 们 至 少 有 两 种 比较 简单 的 方案 可 以 选 
择 : 要 么 把 getter/setter 方 法 都 定义 为 synchronized 方 法 ， 这 样 就 可 以 套用 
管 程 锁定 规则 ;， 要 么 把 value 定 义 为 volatile 变 量 ， 由 于 setter 方 法 对 Value 
的 修改 不 依赖 value 的 原 值 ， 满 足 volatile 关 键 字 使 用 场景 ， 这 样 就 可 以 套 
用 volatile 变 量规 则 来 实现 先行 及 生 关系 。 


通过 上 面 的 例子 ， 我 们 可 以 得 出 结论 : 一 个 操作 “时 间 上 的 先 发 
生 ”* 不 代表 这 个 操作 会 是 “先行 发 生 ， 那 如 果 一 个 操作 “先行 发 生 ” 是 否 
就 能 推导 出 这 个 操作 必定 是 “时 间 上 的 先 发 生 * 呢 ?很 遗憾 ， 这 个 推论 也 
是 不 成 立 的 ， 一 个 典型 的 例子 就 是 多 次 提 到 的 “指令 重 排序 ”， 演 示例 子 
如 代码 清单 12-10 所 示 。 








代码 清单 12-10 ”先行 发 生 原 则 示例 3 


// 以 下 操作 在 同一 个 线程 中 执行 
int i=1; 
int J=2; 











代码 清单 12-10 的 两 条 赋值 语句 在 同一 个 线程 之 中 ， 根 据 程 序 次 序 
规则 ，"int i=1" 的 操作 先行 发 生 于 "int j=2"， 但 是 "int j=2" 的 代码 完全 可 
能 先 被 处 理 器 执行 ， 这 并 不 影响 先行 发 生 原 则 的 正确 性 ， 因 为 我 们 在 这 
条 线程 之 中 没有 办 法 感知 到 这 点 。 


上 面 两 个 例子 综合 起 来 证 明了 一 个 结论 : 时 间 先 后 顺序 与 先行 发 生 
原则 之 间 基 本 没有 太 大 的 关系 ， 所 以 我 们 衡量 并 发 安全 问题 的 时 候 不 要 
受到 时 间 顺 序 的 干扰 ， 一 切 必须 以 先行 及 生 原 则 为 准 。 





12.4 Java 与 线程 


并 发 不 一 定 要 依赖 多 线程 (如 PHP 中 很 常见 的 多 进程 并 发 ) ， 但 是 
在 Java 里 面谈 论 并 发 ， 大 多 数 都 与 线程 脱 不 开关 系 。 既 然 我 们 这 本 书 探 
讨 的 话题 是 Java 虚 拟 机 的 特性 ， 那 讲 到 Java 线 程 ， 我 们 就 从 Java 线 程 在 
虚拟 机 中 的 实现 开始 讲 起 。 





12.4.1 ”线程 的 实现 


我 们 知道 ， 线 程 是 比 进程 更 轻 量 级 的 调度 执行 单位 ， 线 程 的 引入 ， 
可 以 把 一 个 进程 的 资源 分 配 和 执行 调度 分 开 ， 各 个 线程 既 可 以 共享 进程 
资源 (内 存 地 址 、 文 件 VO 等 ) ， 又 可 以 独立 调度 〈 线 程 是 CPU 调度 的 
基本 单位 ) 。 


主流 的 操作 系统 都 提供 了 线程 实现 ，Java 语 言 则 提供 了 在 不 同 硬件 
和 操作 系统 平台 下 对 线程 操作 的 统一 处 理 ， 每 个 已 经 执行 start0 且 还 未 
结束 的 java.lang.Thread 类 的 实例 就 代表 了 一 个 线程 。 我 们 注意 到 Thread 
类 与 大 部 分 的 Java API 有 显著 的 差别 ， 它 的 所 有 关键 方法 都 是 声明 为 
Native 的 。 在 Java API 中 ， 一 个 Native 方 法 往往 意味 着 这 个 方法 没有 使 用 
或 无 法 使 用 平台 无 关 的 手段 来 实现 〈 当 然 也 可 能 是 为 了 执行 效率 而 使 用 
Native 方 法 ， 不 过 ， 通 常 最 高 效率 的 手段 也 就 是 平台 相关 的 手段 ) 。 











因为 如 此 ， 作 者 把 本 节 的 标题 定 为 “线程 的 实现 ?而 不 是 "Java 线程 的 实 
现 ”。 


实现 线程 主要 有 3 种 方式 : 使 用 内 核 线程 实现 、 使 用 用 户 线程 实现 
和 使 用 用 户 线 程 加 轻 量 级 进程 混合 实现 。 


1. 使 用 内 核 线 程 实现 


内 核 线程 (Kemel-Level Thread,KLT) 就 是 直接 由 操作 系统 内 核 
(Kernel， 下 称 内 核 ) 支持 的 线程 ， 这 种 线程 由 内 核 来 完成 线程 切换 ， 
内 核 通 过 操纵 调度 器 〈Scheduler) 对 线程 进行 调度 ， 并 负责 将 线程 的 任 
务 映射 到 各 个 处 理 器 上 。 每 个 内 核 线程 可 以 视 为 内 核 的 一 个 分 身 ， 这 样 
操作 系统 就 有 能 力 同 时 处理 多 件 事情 ， 支 持 多 线程 的 内 核 就 叫做 多 线程 
内 核 (Multi-Threads Kernel) 。 


程序 一 般 不 会 直接 去 使 用 内 核 线程 ， 而 是 去 使 用 内 核 线程 的 一 种 高 
级 接口 一 一 轻 量 级 进程 (Light Weight Process,LWP) ， 轻 量 级 进程 就 是 
我 们 通常 意义 上 所 讲 的 线程 ， 由 于 每 个 轻 量 级 进程 都 由 一 个 内 核 线 程 文 
持 ， 因 此 只 有 先 文 持 内 核 线程 ， 才 能 有 轻 量 级 进程 。 这 种 轻 量 级 进程 与 
内 核 线 程 之 间 1:1 的 关系 称 为 一 对 一 的 线程 模型 ， 如 图 12-3 所 示 。 
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图 12-3 轻 量 级 进程 与 内 核 线程 之 间 1:1 的 关系 


由 于 内 核 线程 的 文 持 ， 每 个 轻 量 级 进程 都 成 为 一 个 独立 的 调度 单 
元 ， 即 使 有 一 个 轻 量 级 进程 在 系统 调用 中 阻塞 了 ， 也 不 会 影响 整个 进程 
继续 工作 ， 但 是 轻 量 级 进程 具有 它 的 局 限 性 : 首先 ， 由 于 是 基于 内 核 线 
程 实 现 的 ， 所 以 各 种 线程 操作 ， 如 创建 、 析 构 及 同步 ， 都 需要 进行 系统 
调用 。 而 系统 调用 的 代价 相对 较 高 ， 需 要 在 用 户 态 〈User Mode) 和 内 
核 态 〈Kernel Mode) 中 来 回 切换 。 其 次 ， 每 个 轻 量 级 进程 都 需要 有 一 
个 内 核 线程 的 文 持 ， 因 此 轻 量 级 进程 要 消耗 一 定 的 内 核资 源 〈 如 内 核 线 
程 的 栈 空间 )， 因 此 一 个 系统 文 持 轻 量 级 进程 的 数量 是 有 限 的 。 











2. 使 用 用 户 线 程 实现 


从 广义 上 来 讲 ， 一 个 线程 只 要 不 是 内 核 线程 ， 就 可 以 认为 是 用 户 线 
程 (User Thread,UT) ， 因 此 ， 从 这 个 定义 上 来 讲 ， 轻 量 级 进程 也 属于 
用 户 线程 ， 但 轻 量 级 进程 的 实现 始终 是 建立 在 内 核 之 上 的 ， 许 多 操作 都 
要 进行 系统 调用 ， 效 率 会 受到 限制 。 


而 狭义 上 的 用 户 线程 指 的 是 完全 建立 在 用 户 空 间 的 线程 库 上 上 ， 系 统 
内 核 不 能 感知 线程 存在 的 实现 。 用 户 线程 的 建立 、 同 步 、 销 毁 和 调度 完 
全 在 用 户 态 中 完成 ， 不 需要 内 核 的 帮助 。 如 果 程 序 实现 得 当 ， 这 种 线程 
不 需要 切换 到 内 核 态 ， 因 此 操作 可 以 是 非常 快速 且 低 消耗 的 ， 也 可 以 支 
持 规模 更 大 的 线程 数量 ， 部 分 高 性 能 数据 库 中 的 多 线程 就 是 由 用 户 线程 
实现 的 。 这 种 进程 与 用 户 线程 之 间 1:N 的 关系 称 为 一 对 多 的 线程 模型 ， 
如 图 12-4 所 示 。 





图 12-4 进程 与 用 户 线程 之 间 1:N 的 关系 


使 用 用 户 线 程 的 优势 在 于 不 需要 系统 内 核 文 援 ， 劣 势 也 在 于 没有 系 
统 内 核 的 文 援 ， 所 有 的 线程 操作 都 需要 用 户 程序 目 己 处 理 。 线 程 的 创 
建 、 切 换 和 调度 都 是 需要 考虑 的 问题 ， 而 且 由 于 操作 系统 只 把 处 理 器 资 
源 分 配 到 进程 ， 那 诸如 “阻塞 如 何 处 理 " 人 “多 处 理 器 系统 中 如 何 将 线程 
映射 到 其 他 处 理 器 上 ”这 类 问题 解决 起 来 将 会 异 肖 困难 ， 甚 至 不 可 能 完 
成 。 因 而 使 用 用 户 线 程 实现 的 程序 一 般 都 比较 复杂 由 ， 除 了 以 前 在 不 支 
持 多 线程 的 操作 系统 中 (如 DOS) 的 多 线程 程序 与 少数 有 特殊 需求 的 程 
序 外 ， 现 在 使 用 用 户 线程 的 程序 越 来 越 少 了 ，Java、Ruby 等 语言 都 曾经 
使 用 过 用 户 线程 ， 最 终 又 部 放弃 使 用 它 。 


3. 使 用 用 户 线 程 加 轻 量 级 进程 混合 实现 


Lb 





线程 除了 依赖 内 核 线 程 实现 和 完全 由 用 户 程序 自己 实现 之 外 ， 还 有 
一 种 将 内 核 线程 与 用 户 线程 一 起 使 用 的 实现 方式 。 在 这 种 混合 实现 下 ， 
距 存 在 用 户 线 程 ， 也 存在 轻 量 级 进程 。 用 户 线程 还 是 完全 建立 在 用 户 空 
间 中 ， 因 此 用 户 线程 的 创建 、 切 换 、 析 构 等 操作 依然 廉价 ， 并 且 可 以 文 
持 大 规模 的 用 户 线程 并 发 。 而 操作 系统 提供 支持 的 轻 量 级 进程 则 作为 用 
户 线 程 和 内 核 线 程 之 间 的 桥 染 ， 这 样 可 以 使 用 内 核 提供 的 线程 调度 功能 
及 处 理 圳 映射， 并 且 用 户 线程 的 系统 调用 要 通过 轻 量 级 线程 来 完成 ， 大 
大 降低 了 整个 进程 被 完全 阻 蹇 的 风险 。 在 这 种 混合 模式 中 ， 用 户 线程 与 
轻 量 级 进程 的 数量 比 是 不 定 的 ， 即 为 N:M 的 关系 ， 如 图 12-5 所 示 ， 这 种 
就 是 多 对 多 的 线程 模型 。 

















许多 UNIX 系 列 的 操作 系统 ， 如 Solaris、HP-UX 等 都 提供 了 N:M 的 


线程 模型 实现 。 





图 12-5 用 户 线程 与 轻 量 级 进程 之 间 N:M 的 关系 


4.Java 线 程 的 实现 











Java 线 程 在 JDK 1.2 之 前 ， 是 基于 称 为 "绿色 线程 ”(Green Threads ) 
的 用 户 线程 实现 的 ， 而 在 JDK 1.2 中 ， 线 程 模型 蔡 换 为 基于 操作 系统 原 
生 线 程 模型 来 实现 。 因 此 ， 在 目前 的 JDK 版 本 中 ， 操 作 系 统 文 持 怎 样 的 
线程 模型 ， 在 很 大 程度 上 决定 了 Java 虚 拟 机 的 线程 是 怎样 映射 的 ， 这 点 
在 不 同 的 平台 上 没有 办 法 达成 一 致 ， 虚 拟 机 规范 中 也 并 未 限定 Java 线 程 
需要 使 用 哪 种 线程 模型 来 实现 。 线 程 模型 只 对 线程 的 并 发 规模 和 操作 成 











本 产生 影响 ， 对 Java 程 序 的 编码 和 运行 过 程 来 说 ， 这 些 差异 都 是 透明 
的 。 


对 于 Sun JDK 来 说 ， 它 的 Windows 版 与 Linux 版 都 是 使 用 一 对 一 的 线 
程 模型 实现 的 ， 一 条 Java 线 程 就 映射 到 一 条 轻 量 级 进程 之 中 ， 因 为 
Windows 和 Linux 系 统 提供 的 线程 模型 就 是 一 对 一 的 品 。 


而 在 Solaris 平 台中 ， 由 于 操作 系统 的 线程 特性 可 以 同时 支持 一 对 一 
(通过 Bound Threads 或 Alternate Libthread 实 现 ) 及 多 对 多 (通过 
LWP/Thread Based Synchronization 实 现 ) 的 线程 模型 ， 因 此 在 Solaris 版 
的 JDK 中 也 对 应 提供 了 两 个 平台 专 有 的 虚拟 机 参数 : - 
XX:+UseLWPSynchronization 〈 默 认 值 ) 和 -XX:+UseBoundThreads 来 明 
确 指定 虚拟 机 使 用 哪 种 线程 模型 。 


四 此 处 所 讲 的 “复杂 ”与 “程序 自己 完成 线程 操作 ”， 并 不 限制 程序 中 
必须 编写 了 复杂 的 实现 用 户 线程 的 代码 ， 使 用 用 户 线程 的 程序 ， 很 多 都 
依赖 特定 的 线程 库 来 完成 基本 的 线程 操作 ， 这 些 复 杂 性 都 封装 在 线程 库 
之 

DJWindows 下 有 纤 程 包 (Fiber Package) ，Linux 下 也 有 NGPT (在 2.4 内 


核 的 年 代 ) 来 实现 N:M 模 型 ， 但 是 它们 都 没有 成 为 主流 。 


12.4.2 Java 线程 调度 


线程 调度 是 指 系统 为 线程 分 配 处 理 器 使 用 权 的 过 程 ， 主 要 调度 方式 
有 两 种 ， 分 别 是 协同 式 线程 调度 (Cooperative Threads-Scheduling) 和 抢 
占 式 线程 调度 (Preemptive Threads-Scheduling) 。 


如 果 使 用 协同 式 调度 的 多 线程 系统 ， 线 程 的 执行 时 间 由 线程 本 里 来 
控制 ， 线 程 把 自己 的 工作 执行 完了 之 后 ， 要 主动 通知 系统 切换 到 男 外 一 
个 线程 上 。 协 同 式 多 线程 的 最 大 好 处 是 实现 简单 ， 而 且 由 于 线程 要 把 自 
己 的 事情 干 完 后 才 会 进行 线程 切换 ， 切 换 操作 对 线程 自己 是 可 知 的 ， 所 
以 没有 什么 线程 同步 的 问题 。Lua 语 言 中 的 “协同 例 程 ?就 是 这 类 实现 。 
它 的 坏处 也 很 明显 : 线程 执行 时 间 不 可 控制 ， 甚 至 如 果 一 个 线程 编写 有 
问题 ， 一 直 不 告知 系统 进行 线程 切换 ， 那 么 程序 就 会 一 直 阻 窄 在 那里 。 
很 久 以 前 的 Windows 3.x 系 统 就 是 使 用 协同 式 来 实现 多 进程 多 任务 的 ， 
相当 不 稳定 ， 一 个 进程 坚持 不 让 出 CPU 执行 时 间 就 可 能 会 导致 整个 系统 
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如 果 使 用 抢占 式 调度 的 多 线程 系统 ， 那 么 每 个 线程 将 由 系统 来 分 配 
执行 时 间 ， 线 程 的 切换 不 由 线程 本 号 来 决定 (在 Java 中 ，Thread.yield() 
可 以 让 出 执行 时 间 ， 但 是 要 获取 执行 时 间 的 话 ， 线 程 本 身 是 没有 什么 办 
法 的 ) 。 在 这 种 实现 线程 调度 的 方式 下 ， 线 程 的 执行 时 间 是 系统 可 控 











的 ， 也 不 会 有 一 个 线程 导致 整个 进程 阻塞 的 问题 ，Java 使 用 的 线程 调度 
方式 就 是 抢占 式 调度 1。 与 前 面 所 说 的 Windows 3.x 的 例子 相对 ， 在 

Windows 9x/NT 内 核 中 就 是 使 用 抢占 式 来 实现 多 进程 的 ， 当 一 个 进程 出 
了 问题 ， 我 们 还 可 以 使 用 任务 管理 喜 把 这 个 进程 < 杀 卸 ?， 而 不 至 于 导致 


系统 朋 演 。 





虽然 Java 线 程 调 度 是 系统 自动 完成 的 ， 但 是 我 们 还 是 可 以 “建议 ” 系 
统 给 某 些 线程 多 分 配 一 点 执行 时 间 ， 另 外 的 一 些 线程 则 可 以 少 分 配 一 点 
一 一 这 项 操作 可 以 通过 设置 线程 优先 级 来 完成 。Java 语 言 一 共 设 置 了 10 
个 级 别 的 线程 优先 级 (Thread.MIN_PRIORITY 至 
Thread.MAX_PRIORITY ) ， 在 两 个 线程 同时 处 于 Ready 状 态 时 ， 优 先 级 
越 高 的 线程 越 容易 被 系统 选择 执行 。 





不 过 ， 线 程 优先 级 并 不 是 太 靠 谱 ， 原 因 是 Java 的 线程 是 通过 映射 到 
系统 的 原生 线程 上 来 实现 的 ， 所 以 线程 调度 最 终 还 是 取决 于 操作 系统 ， 
虽然 现在 很 多 操作 系统 都 提供 线程 优先 级 的 概念 ， 但 是 并 不 见得 能 与 
Java 线 程 的 优先 级 一 一 对 应 ， 如 Solaris 中 有 2147483648 (23*) 种 优先 
级 ， 但 Windows 中 就 只 有 7 种 ， 比 Java 线 程 优先 级 多 的 系统 还 好 说 ， 中 间 
留 下 一 点 空位 就 可 以 了 ,但 比 Java 线 程 优先 级 少 的 系统 ， 就 不 得 不 出 现 
几 个 优先 级 相同 的 情况 了 ， 表 12-1 显 示 了 Java 线 程 优先 级 与 Windows 线 
程 优先 级 之 间 的 对 应 关系 ，Windows 平 台 的 JDK 中 使 用 了 除 
THREAD_PRIORITY_IDLE 之 外 的 其 余 6 种 线程 优先 级 。 








表 12-1 Java 线程 优先 级 与 Windows 线程 优先 级 之 间 的 对 应 关系 

Java 线程 优先 级 Windows 线程 优先 级 

1 (Thread.MIN PRIORITY ) THREAD PRIORITY LOWEST 
THREAD PRIORITY LOWEST 

















地 THREAD PRIORITY BELOW NORMAL 
十 THREAD PRIORITY BELOW NORMAL 
S (Thread.NORM PRIORITY) THREAD PRIORITY NORMAL 
6 THREAD PRIORITY ABOVE NORMAL 
7 THREAD PRIORITY ABOVE NORMAL 
8 THREAD PRIORITY HIGHEST 
9 THREAD PRIORITY HIGHEST 
10 (Thread.MAX PRIORITY) THREAD PRIORITY CRITICAL 





上 文 说 到 “线程 优先 级 并 不 是 太 靠 谱 *"， 不 仅仅 是 说 在 一 些 平台 上 不 
同 的 优先 级 实际 会 变 得 相同 这 一 点 ， 还 有 其 他 情况 让 我 们 不 能 太 依 赖 优 
先 级 : 优先 级 可 能 会 被 系统 自行 改变 。 例 如 ， 在 Windows 系 统 中 存在 一 
个 称 为 “优先 级 推进 器 ”(Priority Boosting， 当 然 它 可 以 被 关闭 掉 ) 的 功 
能 ， 它 的 大 致 作用 就 是 当 系统 发 现 一 个 线程 执行 得 特别 “勤奋 努力 ”的 
， 可 能 会 越过 线程 优先 级 去 为 它 分 配 执行 时 间 。 因 此 ， 我 们 不 能 在 程 
序 中 通过 优先 级 来 完全 准确 地 判断 一 组 状态 都 为 Ready 的 线程 将 会 先 执 
行 哪 一 个 。 





于 


[1 在 JDK 后 续 版 本 中 有 可 能 会 提供 协 程 (Coroutines) 方式 来 进行 多 任务 
处 理 ， 相 关 资 料 可 参见 : http://wikis.sun.com/display/mlvm/Coroutines。 


12.4.3 ”状态 转换 


Java 语 言 定义 了 5 种 线程 状态 ， 在 任意 一 个 时 间 点 ， 一 个 线程 只 能 
有 且 只 有 其 中 的 一 种 状态 ， 这 5 种 状态 分 别 如 下 。 





新 建 〈New) : 创建 后 尚未 启动 的 线程 处 于 这 种 状态 。 


运行 《Runable) : Runable 包 括 了 操作 系统 线程 状态 中 的 Running 和 
Ready， 也 就 是 处 于 此 状态 的 线程 有 可 能 正在 执行 ， 也 有 可 能 正在 等 待 
者 CPU 为 它 分 配 执行 时 间 。 


无 限期 等 待 (Waiting) : 处 于 这 种 状态 的 线程 不 会 被 分 配 CPU 执 行 
时 间 ， 它 们 要 等 待 被 其 他 线程 显 式 地 唤醒 。 以 下 方法 会 让 线程 陷入 无 限 


期 的 等 待 状 
e 没 有 设置 Timeout 参 数 的 Object.wait(0) 方 法 。 
e 没 有 设置 Timeout 参 数 的 Thread.join() 方 法 。 
eLockSupport.park() 方 法 。 


限期 等 待 〈Timed Waiting) : 处 于 这 种 状态 的 线程 也 不 会 被 分 配 
CPU 执 行 时 间 ， 不 过 无 须 等 待 被 其 他 线程 显 式 地 唤醒 ， 在 一 定时 间 之 后 
它们 会 由 系统 自动 唤醒 。 以 下 方法 会 让 线程 进入 限期 等 待 状态 : 





eThread.sleep() 方 法 。 

e 设 置 了 Timeout 参 数 的 Object.wait0 方 法 。 
e 设 置 了 Timeout 参 数 的 Thread.join0 方 法 。 
eLockSupport.parkNanos() 方 法 。 
eLockSupport.parkUntil() 方 法 。 


阻塞 〈Blocked) : 线程 被 阻塞 了 , “阻塞 状态 ”与 “等 待 状态 ”的 区 别 
古 :“ 阻 塞 状态 ”在 等 待 着 获取 到 一 个 排他 锁 ， 这 个 事件 将 在 另外 一 个 线 
程 放弃 这 个 锁 的 时 候 发 生 ;， 而 “等 竺 状态 ? 则 是 在 等 待 一 段 时 间 ， 或 者 唤 
醒 动 作 的 发 生 。 在 程序 等 待 进入 同步 区 域 的 时 候 ， 线 程 将 进入 这 种 状 


太 


JU Oo 


结束 〈Terminated) : 已 终止 线程 的 线程 状态 ， 线 程 已 经 结束 执 


上 述 5 种 状态 在 遇 到 特定 事件 发 生 的 时 候 将 会 互相 转换 ， 它 们 的 转 
换 关 系 如 图 12-6 所 示 。 


Blocked 


synchronized 


imed Waiting 


图 12-6 线程 状态 转换 关系 










sleep() 





run() 结 束 


notify()/notifyAll() 


wait() 





12.5 本章 小 结 


本 章 中 ， 我 们 首先 了 解 了 虚拟 机 Java 内 存 模型 的 结构 及 操作 ， 然 后 
讲解 了 原子 性 、 可 见 性 、 有 序 性 在 Java 内 存 模型 中 的 体现 ， 最 后 介绍 了 
先行 发 生 原则 的 规则 及 使 用 。 田 外， 我 们 还 了 解 了 线程 在 Java 语 言 之 中 
是 如 何 实 现 的 。 








关于 “高 效 并 发 "这 个 话题 ， 在 本 章 中 主要 介绍 了 虚拟 机 如 何 实 
现 “ 并 发 "， 在 第 13 章 中， 我 们 的 主要 关注 点 将 是 虚拟 机 如 何 实现 “高 
效 ”， 以 及 虚拟 机 对 我 们 编写 的 并 发 代码 提供 了 什么 样 的 优化 手段 。 


第 13 章 ”线程 安全 与 锁 优 化 





并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定 律 代替 摩尔 定律 成 为 计算 机 
性 能 发 展 源 动 力 的 根本 原因 ， 也 是 人 类 “压榨 ?计算 机 运算 能 力 的 最 有 力 
武 右 。 





13.1 概述 








在 软件 业 发 展 的 初期 ， 程 序 编写 都 是 以 算法 为 核心 的 ， 程 序 员 会 把 
数据 和 过 程 分 别 作为 独立 的 部 分 来 考虑 ， 数 据 代 表 问 题 空间 中 的 客体 ， 
程序 代码 则 用 于 处 理 这 些 数据 ， 这 种 思维 方式 下 接站 在 计算 机 的 角度 去 
抽象 问题 和 解决 问题 ， 称 为 面 同 过 程 的 编程 思想 。 与 此 相对 的 是 ， 面 癌 
对 象 的 编程 思想 是 站 在 现实 世界 的 角度 去 抽象 和 解决 问题 ， 它 把 数据 和 
行为 都 看 做 是 对 象 的 一 部 分 ， 这 样 可 以 让 程序 员 能 以 符合 现实 世界 的 思 
维 方式 来 编写 和 组 织 程序 。 





面向 过 程 的 编程 思想 极 大 地 提升 了 现代 软件 开发 的 生产 效率 和 软件 
可 以 达到 的 规模 ， 但 是 现实 世界 与 计算 机 世界 之 间 不 可 避免 地 存在 一 些 
差异 。 例 如 ， 人 们 很 难 想 象 现实 中 的 对 象 在 一 项 工作 进行 期 间 ， 会 被 不 
停 地 中 断 和 切换 ， 对 象 的 属性 数据， 可 能 会 在 中 断 期 间 被 修改 和 
变 “ 脏 ”， 而 这 些 事件 在 计算 机 世界 中 则 是 很 正常 的 事情 。 有 时候 ， 民 好 





的 设计 原则 不 得 不 向 现实 做 出 一 些 让 步 ， 我 们 必须 让 程序 在 计算 机 中 正 
确 无 误 地 运行 ， 然 后 再 考虑 如 何 将 代码 组 织 得 更 好 ， 让 程序 运行 得 更 
快 。 对 于 这 部 分 的 主题 “高 效 并 发 "来 讲 ， 前 先 需 要 保证 并 发 的 正确 性 ， 
然后 在 此 基础 上 实现 高 效 。 本 章 先 从 如 何 保证 并 发 的 正确 性 和 如 何 实现 
线程 安全 讲 起 。 
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“线程 安全 ”这 个 名 称 ， 相 信 稍 有 经 验 的 程序 员 都 会 听 说 过 ， 甚 全 在 
代码 编写 和 走 但 的 时 候 可 能 还 会 经 常 挂 在 嘴 边 ， 但 是 如 何 找 到 一 个 不 太 
抛 口 的 概念 来 定义 线程 安全 却 不 是 一 件 容易 的 事情 ， 笔 者 尝试 在 Google 
中 搜索 它 的 概念 ， 找 到 的 是 类 似 于 “如 果 一 个 对 象 可 以 安全 地 被 多 个 线 
程 同 时 使 用 ， 那 它 就 是 线程 安全 的 ”这 样 的 定义 一 一 并 不 能 说 它 不 正 
确 ， 但 是 人 们 无 法 从 中 获取 到 任何 有 用 的 信息 。 


笔者 认为 《Java Concurrency In Practice》 的 作者 Brian Goetz 对 “线程 
安全 ”有 一 个 比较 恰当 的 定义 :“ 当 多 个 线程 访问 一 个 对 象 时 ， 如 果 不 用 
考虑 这 些 线程 在 运行 时 环境 下 的 调度 和 交 蔡 执行 ， 也 不 需要 进行 额外 的 
同步 ， 或 者 在 调用 方 进行 任何 其 他 的 协调 操作 ， 调 用 这 个 对 象 的 行为 都 
可 以 获得 正确 的 结果 ， 那 这 个 对 象 是 线程 安全 的 ”。 


这 个 定义 比较 严谨 ， 它 要 求 线程 安全 的 代码 都 必须 具备 一 个 特征 : 
代码 本 身 封 装 了 所 有 必要 的 正确 性 保障 手段 〈 如 互 斥 同步 等 ) ， 令 调用 
者 无 须 关 心 多 线程 的 问题 ， 更 无 须 目 己 采取 任何 措施 来 保证 多 线程 的 正 
确 调用 。 这 点 听 起 来 简单 ， 但 其 实 并 不 容易 做 到 ， 在 大 多 数 场景 中 ， 我 
们 都 会 将 这 个 定义 弱化 一 些 ， 如 果 把 “调用 这 个 对 象 的 行为 ?限定 为 < 单 
次 调用 ”， 这 个 定义 的 其 他 描述 也 能 够 成 立 的 话 ， 我 们 就 可 以 称 它 是 线 


程 安 全 了 ， 为 什么 要 弱化 这 个 定义 ， 现 在 和 暂且 放下 ， 稍 后 再 详细 探讨 。 


13.2.1 Java 语言 中 的 线程 安全 





我 们 已 经 有 了 线程 安全 的 一 个 抽象 定义 ， 那 接 下 来 就 讨论 一 下 在 
Java 语 言 中 ， 线 程 安全 具体 是 如 何 体现 的 ? 有 哪些 操作 是 线程 安全 的 ? 
我 们 这 里 讨论 的 线程 安全 ， 就 限定 于 多 个 线程 之 间 存 在 共享 数据 访问 这 
个 前 提 ， 因 为 如 果 一 段 代码 根本 不 会 与 其 他 线程 共 译 数据 ， 那 么 从 线程 
安全 的 角度 来 看 ， 程 序 是 串 行 执行 还 是 多 线程 执行 对 它 来 说 是 完全 没有 
区 别 的。 











为 了 更 加 深入 地 理解 线程 安全 ， 在 这 里 我 们 可 以 不 把 线程 安全 当做 
一 个 非 真 即 假 的 二 元 排他 选项 来 看 待 ， 按 照 线程 安全 的 “安全 程度 "由 强 
至 弱 来 排序 ， 我 们 由 可 以 将 Java 语 言 中 各 种 操作 共享 的 数据 分 为 以 下 5 
类 : 不 可 变 、 绝 对 线程 安全 、 相 对 线程 安全 、 线 程 兼容 和 线程 对 立 。 


1. 不 可 变 


在 Java 语 言 中 《〈 特 指 JDK 1.5 以 后 ， 即 Java 内 存 模 型 被 修正 之 后 的 
Java 语 言 )》 ， 不 可 变 (Immutable) 的 对 象 一 定 是 线程 安全 的 ， 无 论 是 对 
象 的 方法 实现 还 是 方法 的 调用 者 ， 都 不 需要 再 采取 任何 的 线程 安全 保障 
彰 施 ， 在 第 12 章 我 们 谈 到 final 关 键 字 带 来 的 可 见 性 时 曾经 提 到 过 这 一 
点 ， 只 要 一 个 不 可 变 的 对 象 被 正确 地 构建 出 来 (没有 发 生 this 引 用 逃逸 


的 情况 )， 那 其 外 部 的 可 见 状态 永远 也 不 会 改变 ， 永 远 也 不 会 看 到 它 在 
多 个 线程 之 中 处 于 不 一 致 的 状态 。“ 不 可 变 ” 带 来 的 安全 性 是 最 简单 和 最 
纯粹 的 。 


Java 语 言 中 ， 如 果 共 享 数据 是 一 个 基本 数据 类 型 ， 那 么 只 要 在 定义 
时 使 用 final 关 键 字 修饰 它 就 可 以 保证 它 是 不 可 变 的 。 如 果 共 享 数据 是 一 
个 对 象 ， 那 就 需要 保证 对 象 的 行为 不 会 对 其 状态 产生 任何 影响 才 行 ， 如 
果 读 者 还 没 想 明白 这 句 话 ， 不 妨 想 一 想 java.lang.String 类 的 对 象 ， 

一 个 典型 的 不 可 变 对 象 ， 我 们 调用 它 的 substringO0、replace0 和 concat(O 这 
些 方法 都 不 会 影响 它 原 来 的 值 ， 只 会 返回 一 个 新 构造 的 字符 串 对 象 。 





保证 对 象 行为 不 影响 自己 状态 的 途径 有 很 多 种 ， 其 中 最 简单 的 就 是 
把 对 象 中 带 有 状态 的 变量 都 声明 为 final， 这 样 在 构造 函数 结束 之 后 ， 它 
就 是 不 可 变 的 ， 例 如 代码 清单 13-1 中 java.lang.Integer 构 造 函数 所 示 的 ， 
通过 将 内 部 状态 变量 value 定 义 为 final 来 保障 状态 不 变 。 








代码 清单 13-1 JDK 中 Integer 类 的 构造 函数 





/** 

*The value of the<code>Integer</code>. 
*@serial 
六 7 
private final int Value 
/** 
*Constructs a newly allocated<code>Integer</code>object that 


*represents the specified<code>int</code>value. 
光 






































*Qparam Value the Value to be represented by the 
*<code>Integer</code>object. 








«yf 
public Integer (int value) { 
this.value=value:; 


} 








在 Java API 中 符合 不 可 变 要 求 的 类 型 ， 除 了 上 面 提 到 的 String 之 外 ， 
常用 的 还 有 枚 举 类 型 ， 以 及 java.lang.Number 的 部 分 子 类 ， 如 Long 和 
Double 等 数值 包装 类 型 ，BigInteger 和 BigDecimal 等 大 数据 类 型 ， 但 同 为 
Number 的 子 类 型 的 原子 类 AtomicInteger 和 AtomicLong 则 并 非 不 可 变 
的 ， 读 者 不 妨 看 看 这 两 个 原子 类 的 源码 ， 想 一 想 为 什么 。 





2. 绝 对 线程 安全 


绝对 的 线程 安全 完全 满足 Brian Goetz 给 出 的 线程 安全 的 定义 ， 这 个 
定义 其 实 是 很 严格 的 ， 一 个 类 要 达到 “不 省 运行 时 环境 如 何 ， 调 用 者 都 
不 需要 任何 额外 的 同步 措施 ?通常 需要 付出 很 大 的 ， 甚 全 有 时 候 是 不 切 
实际 的 代价 。 在 Java API 中 标注 自己 是 线程 安全 的 类 ， 大 多 数 都 不 是 绝 
对 的 线程 安全 。 我 们 可 以 通过 Java API 中 一 个 不 是 “绝对 线程 安全 ”的 线 
程 安全 类 来 看 看 这 里 的 “绝对 ”是 什么 意思 。 


如 果 说 java.util.Vector 是 一 个 线程 安全 的 容器 ， 相 信 所 有 的 Java 程 序 
员 对 此 都 不 会 有 异议 ， 因 为 它 的 add0、getO0 和 size() 这 类 方法 都 是 被 
synchronized 修 饰 的 ， 尽 管 这 样 效率 很 低 ， 但 确实 是 安全 的 。 但 是 ， 即 
使 它 所 有 的 方法 都 被 修饰 成 同步 ， 也 不 意味 着 调用 它 的 时 候 永远 都 不 再 
需要 同步 手段 7 了， 请 看 一 下 代码 清单 13-2 中 的 测试 代码 。 


代码 清单 13-2 ”对 Vector 线程 安全 的 测试 








Private static Vector<Integer>vector=new Vector 过 Intedger 之 () ; 
public static void main (String[]args) 1 

while (true) { 

for (int i=0; i<10; i++) { 

vector.add (i); 

} 


Thread removeThread=new Thread (new Runnable(){ 




















QOverride 
public void run(){ 
for (int i=0; i<vector.size(); i++) { 








vector.remove (i); 

} 

} 

1 

Thread printThread=new Thread (new Runnapble(){ 


QOverride 
public void run(){ 
for (int i=0; i<vector.size(); i++) { 








System.out.println ( (vector.get (i) ) ) ; 
} 

} 

}) ; 

removeThread.start (); 
printThread.start () ; 

// 不 要 同时 产生 过 多 的 线程 ， 否 则 会 导致 操作 系统 假死 
while (Thread.activeCount () >20); 

} 

} 








运行 结果 如 下 : 








Exception in thread"Thread- 
132"java.lang.ArrayIndexOutOfBoundsException: 
Array index out of range:17 

at java.util.Vector.remove (Vector.java:777) 

at org.fenixsoft.mulithread.VectorTest$1.run (VectorTest.java:21) 
at 


java.lang.Thread.run (Thread.java:662) 



































一 | 


很 明显 ， 尽 管 这 里 使 用 到 的 Vector 的 get0、removeO0 和 size() 方 法 都 
是 同步 的 ， 但 是 在 多 线程 的 环境 中 ， 如 果 不 在 方法 调用 端 做 额外 的 同步 
音 施 的 话 ， 使 用 这 段 代 码 仍然 是 不 安全 的 ， 因 为 如 果 另 一 个 线程 恰好 在 
错误 的 时 间 里 删除 了 一 个 元 素 ， 导 致 序号 已 经 不 再 可 用 的 话 ， 再 用 ij 访 
问 数组 就 会 抛 出 一 个 ArrayIndexOutOfBoundsException。 如 果 要 保证 这 
段 代 码 能 正确 执行 下 去 ， 我 们 不 得 不 把 removeThread 和 printThread 的 定 
义 改 成 如 代码 清单 13-3 所 示 的 样子 。 





代码 清单 13-3 ”必须 加 入 同步 以 保证 Vector 访问 的 线程 安全 性 





Thread removeThread=new Thread (new Runnable(){ 
QOverride 

public void run(){ 

synchronized (vector) { 

for (int i=0; i<vector.size(); i++) 1 
vector.remove (i).; 

} 

} 

} 

}) ; 

Thread printThread=new Thread (new Runnapbple(){ 
QOverride 

public void run()i 

synchronized (vector) { 

for (int i=0; i<vector.size(); i++) 1 
System.out.println ( (vector.get (i) ) ) ; 

} 

} 

} 

}) ; 




















3. 相 对 线程 安全 


相对 的 线程 安全 就 是 我 们 通常 意义 上 所 讲 的 线程 安全 ， 它 需要 保证 
对 这 个 对 象 单独 的 操作 是 线程 安全 的 ， 我 们 在 调用 的 时 候 不 需要 做 额外 
的 保障 措施 ， 但 是 对 于 一 些 特定 顺序 的 连续 调用 ， 就 可 能 需要 在 调用 端 
使 用 额外 的 同步 手段 来 保证 调用 的 正确 性 。 上 面 代码 清单 13-2 和 代码 清 
单 13-3 就 是 相对 线程 安全 的 明显 的 案例 。 


在 Java 语 言 中 ， 大 部 分 的 线程 安全 类 都 属于 这 种 类 型 ， 例 如 
Vector、HashTable、Collections 的 synchronizedCollection() 方 法 包装 的 集 


人 人、 入 
人 


4. 线 程 兼容 


线程 兼容 是 指 对 象 本 身 并 不 是 线程 安全 的 ， 但 是 可 以 通过 在 调用 端 
正确 地 使 用 同步 手段 来 保证 对 象 在 并 发 环境 中 可 以 安全 地 使 用 ， 我 们 平 
常 说 一 个 类 不 是 线程 安全 的 ， 绝 大 多 数 时 候 指 的 是 这 一 种 情况 。Java 
API 中 大 部 分 的 类 都 是 属于 线程 兼容 的 ， 如 与 前 面 的 Vector 和 HashTable 
相对 应 的 集合 类 ArrayList 和 HashMap 等 。 








5. 线 程 对 六 





线程 对 立 是 指 无 论调 用 端 是 否 采取 了 同步 措施 ， 都 无 法 在 多 线程 环 
卉 中 并 发 使 用 的 代码 。 由 于 Java 语 言 天 生 就 具备 多 线程 特性 ， 线 程 对 芯 
这 种 排斥 多 线程 的 代码 是 很 少 出 现 的 ， 而 且 通 党 都 是 有 害 的 ， 应 当 尽 量 


避免 。 








一 个 线程 对 立 的 例子 是 Thread 类 的 suspend() 和 resume() 方 法 ， 如 果 
有 两 个 线程 同时 持 有 一 个 线程 对 象 ， 一 个 尝试 去 中 断 线程 ， 另 一 个 尝试 
去 恢复 线程 ， 如 果 并 发 进行 的 话 ， 无 论调 用 时 是 否 进行 了 同步 ， 目 标 线 
程 都 是 存在 死 锁 风 险 的， 如 果 suspend0 中 断 的 线程 就 是 即将 要 执行 
resume() 的 那个 线程 ， 那 就 肯定 要 产生 死 锁 了。 也 正 是 由 于 这 个 原因 ， 
suspend() 和 resume() 方 法 已 经 被 JDK 声 明 废 弃 (@Deprecated) 了 。 常 见 








的 线程 对 立 的 操作 还 有 System.setIn()、Sytem.setOut() 和 


System.runFinalizersOnExit() 等 。 


四 这 种 划分 方法 也 是 Btian Goetz 在 IBM developWorkers 上 发 表 的 一 篇 论文 


中 提出 的 ， 这 里 写 “ 我 们 ”纯粹 是 笔者 下 笔 行文 中 的 语言 用 法 。 


13.22 线程 安全 的 实现 方法 


了 解 了 什么 是 线程 安全 之 后 ， 紧 接着 的 一 个 问题 就 是 我 们 应 该 如 何 
实现 线程 安全 ， 这 听 起 来 似乎 是 一 件 由 代码 如 何 编写 来 决定 的 事情 ， 确 
实 ， 如 何 实现 线程 安全 与 代码 编写 有 很 大 的 关系 ， 但 虚拟 机 提供 的 同步 
和 锁 机 制 也 起 到 了 非常 重要 的 作用 。 本 节 中 ， 代 码 编写 如 何 实 现 线程 安 
全 和 虚拟 机 如 何 实现 同步 与 锁 这 两 者 都会 有 所 涉及 ， 相 对 而 言 更 偏重 后 
者 一 些 ， 只 要 读者 了 解 了 虚拟 机 线程 安全 手段 的 运作 过 程 ， 上 自己 去 思考 
代码 如 何 编写 并 不 是 一 件 困 难 的 事情 。 


























1. 互 斥 同 步 


互 斥 同步 (Mutual Exclusion&Synchronization) 是 常见 的 一 种 并 发 
正确 性 保障 手段 。 同 步 是 指 在 多 个 线程 并 发 访问 共享 数据 时 ， 保 证 共享 
数据 在 同一 个 时 刻 只 被 一 个 〈 或 者 是 一 些 ， 使 用 信号 量 的 时 候 ) 线程 使 
用 。 而 互 斥 是 实现 同步 的 一 种 手段 ， 临 界 区 (Critical Section) 、 互 斥 
量 (Mutex) 和 信号 量 〈Semaphore) 都 是 主要 的 互 斥 实现 方式 。 因 此 ， 
在 这 4 个 字 里 面 ， 互 斥 是 因 ， 同 步 是 果 ; 互 斥 是 方法 ， 同 步 是 目的 。 














在 Java 中 ， 最 基本 的 互 斥 同步 手段 束 是 synchronized 关 键 字 ， 
synchronized 关 键 字 经 过 编译 之 后 ， 会 在 同步 块 的 前 后 分 别 形成 


monitorenter 和 monitorexit 这 两 个 字 节 人 码 指令 ， 这 两 个 字 节 码 都 需要 一 个 


reference 类 型 的 参数 来 指明 要 锁定 和 解锁 的 对 象 。 如 果 Java 程 序 中 的 
synchronized 明 确 指定 了 对 象 参数 ， 那 驶 是 这 个 对 象 的 reference; 如 果 没 
有 明确 指定 ， 那 就 根据 synchronized 修 饰 的 是 实例 方法 还 是 类 方法 ， 去 
取 对 应 的 对 象 实例 或 Class 对 象 来 作为 锁 对 象 。 





根据 虚拟 机 规范 的 要 求 ， 在 执行 monitorenter 指 令 时 ， 首 先 要 尝试 获 
取 对 象 的 锁 。 如 果 这 个 对 象 没 被 锁定 ， 或 者 当前 线程 已 经 拥有 了 那个 对 
象 的 锁 ， 把 锁 的 计数 融 加 1， 相 应 的 ， 在 执行 monitorexit 指 令 时 会 将 锁 计 
数 融 减 1， 当 计数 器 为 0 时 ， 锁 台 被 释放 。 如 果 获 取 对 象 锁 失 败 ， 那 当前 
线程 就 要 阻 竖 等 待 ， 直 到 对 象 锁 被 另外 一 个 线程 释放 为 止 。 


在 虚拟 机 规范 对 monitorenter 和 monitorexit 的 行为 描述 中 ， 有 两 点 是 
需要 特别 注意 的 。 首 先 ，synchronized 同 步 块 对 同一 条 线程 来 说 是 可 重 
入 的 ， 不 会 出 现 自己 把 自己 锁 死 的 问题 。 其 次 ， 同 步 块 在 已 进入 的 线程 
执行 完 之 前 ， 会 阻塞 后 面 其 他 线程 的 进入 。 第 12 章 讲 过 ，Java 的 线程 是 
映射 到 操作 系统 的 原生 线程 之 上 的 ， 如 果 要 阻塞 或 唤醒 一 个 线程 ， 都 需 
要 操作 系统 来 帮忙 完成 ， 这 就 需要 从 用 户 态 转 换 到 核心 态 中 ， 因 此 状态 
转换 需要 耗费 很 多 的 处 理 器 时 间 。 对 于 代码 简单 的 同步 块 〈 如 被 
synchronized 修 饰 的 getter0 或 setter0 方 法 ) ， 状 态 转换 消耗 的 时 间 有 可 能 
比 用 户 代码 执行 的 时 间 还 要 长 。 所 以 synchronized 是 Java 语 言 中 一 个 重量 
级 〈Heavyweight) 的 操作 ， 有 经 验 的 程序 员 都 会 在 确实 必要 的 情况 下 
才 使 用 这 种 操作 。 而 虚拟 机 本 身 也 会 进行 一 些 优化 ， 壁 如 在 通知 操作 系 








统 阻 蹇 线程 之 前 加 入 一 段 目 旋 等 街 过程 ， 避 免 频 繁 地 切入 到 核心 态 之 
中 。 


除了 synchronized 之 外 ， 我 们 还 可 以 使 用 java.util.concurrent (下文 称 
JU.C) 包 中 的 重 入 锁 (ReentrantLock) 来 实现 同步 ， 在 基本 用 法 上 ， 
ReentrantLock 与 Synchronized 很 相似 ， 他 们 都 具备 一 样 的 线程 重 入 特 
性 ， 只 是 代码 写法 上 有 抬 区 别 ， 一 个 表现 为 API 层 面 的 互 奈 锁 〈lockO 和 
unlock0) 方 法 配合 try/finally 语 句 块 来 完成 )， 男 一 个 表现 为 原生 语法 层 
面 的 互 斥 锁 。 不 过 ， 相 比 synchronized,ReentrantLock 增 加 了 一 些 高 级 功 
能 ， 主 要 有 以 下 3 项 : 等 待 可 中 断 、 可 实现 公平 锁 ， 以 及 锁 可 以 绑 定 多 


个 条 件 。 


等 竺 可 中 断 是 指 当 持 有 锁 的 线程 长 期 不 释放 锁 的 时 候 ， 正 在 等 待 的 
线程 可 以 选择 放 奔 等待 ， 改 为 处 理 其 他 事情 ， 可 中 断 特 性 对 处 理 执行 时 
间 非 第 长 的 同步 块 很 有 帮助 。 





公平 锁 是 指 多 个 线程 在 等 竺 同一 个 锁 时 ， 必 须 按照 申请 锁 的 时 间 顺 
序 来 依次 获得 锁 ; 而 非 公 平 锁 则 不 保证 这 一 点 ， 在 锁 被 释放 时 ， 任 何 一 
个 等 待 锁 的 线程 都 有 机 会 获得 锁 。synchronized 中 的 锁 是 非 公 平 的 ， 
ReentrantLock 默 认 情 况 下 也 是 非 公 平 的 ， 但 可 以 通过 带 布尔 值 的 构造 函 
数 要 求 使 用 公平 锁 。 








锁 绑 定 多 个 条 件 是 指 一 个 ReentrantLock 对 象 可 以 同时 绑 定 多 个 


Condition 对 象 ， 而 在 synchronized 中 ， 锁 对 象 的 wait0 和 mnotify0 或 
notifyAll0 方 法 可 以 实现 一 个 隐 含 的 条 件 ， 如 果 要 和 多 于 一 个 的 条 件 关 
联 的 时 候 ， 就 不 得 不 额外 地 添加 一 个 锁 ， 而 ReentrantLock 则 无 顷 这 样 
做 ， 只 需要 多 次 调用 newCondition() 方 法 即 可 。 


如 果 需 要 使 用 上 述 功能 ， 选 用 ReentrantLock 是 一 个 很 好 的 选择 ， 那 
如 果 是 基于 性 能 考虑 呢 ? 关于 synchronized 和 ReentrantLock 的 性 能 问 
题 ，Brian Goetz 对 这 两 种 锁 在 JDK 1.5 与 单 核 处 理 器 ， 以 及 JDK 1.5 与 双 
Xeon 处 理 器 环境 下 做 了 一 组 吞吐 量 对 比 的 实验 册 ， 实 验 结果 如 图 13-1 和 


图 13-2 所 示 。 
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图 13-1 JDK1.5、 单 核 处 理 器 下 两 种 锁 的 吞吐 量 对 比 


从 图 13-1 和 图 13-2 可 以 看 出 ， 多 线程 环境 下 synchronized 的 吞吐 量 下 


TA 


条 得 非常 严重 ， 而 ReentrantLock 则 能 基本 保持 在 同一 个 比较 稳定 的 水 平 
上 。 与 其 说 ReentrantLock 性 能 好 ， 还 不 如 说 synchronized 还 有 非常 大 的 

优化 余地 。 后 续 的 技术 发 展 也 证 明了 这 一 点 ，JDK 1.6 中 加 入 了 很 多 针 

对 锁 的 优化 措施 (13.3 厄 我 们 就 会 讲解 这 些 优化 措施 ) ，JDK 1.6 发 布 之 
后 ， 人 们 就 发 现 synchronized 与 ReentrantLock 的 性 能 基本 上 是 完全 持平 

了 。 因 此 ， 如 果 读 者 的 程序 是 使 用 JDK 1.6 或 以 上 部 署 的 话 ， 性 能 因素 

就 不 再 是 选择 ReentrantLock 的 理由 了 ， 虚 拟 机 在 未 来 的 性 能 改进 中 肯定 
也 会 更 加 偏向 于 原生 的 synchronized， 所 以 还 是 提倡 在 synchronized 能 实 
现 需求 的 情况 下 ， 优 先 考虑 使 用 synchronized 来 进行 同步 。 
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图 13-2 JDK 1.5、 双 Xeon 处 理 器 下 两 种 锁 的 吞吐 量 对 比 


2. 非 阻塞 同步 





互 斥 同步 最 主要 的 问题 就 是 进行 线程 阻 豆 和 唤醒 所 带 来 的 性 能 问 


题 ， 因 此 这 种 同步 也 称 为 阻塞 同步 〈Blocking Synchronization ) 。 从 处 
理 问 题 的 方式 上 说 ， 互 斥 同步 属于 一 种 悲观 的 并 发 策略 ， 总 是 认为 只 要 
不 去 做 正确 的 同步 措施 《例如 加 锁 ) ， 那 就 肯定 会 出 现 问题 ， 无 论 共享 
数据 是 否 真 的 会 出 现 竞 争 ， 它 都 要 进行 加 锁 〈 这 里 讨论 的 是 概念 模型 ， 

实际 上 虚拟 机 会 优化 掉 很 大 一 部 分 不 必要 的 加 锁 ) 、 用 户 态 核 心态 转 

换 、 维 护 锁 计数 器 和 检查 是 否 有 被 阻塞 的 线程 需要 唤醒 等 操作 。 随 着 硬 
件 指 令 集 的 发 展 ， 我 们 有 了 另外 一 个 选择 : 基于 冲突 检测 的 乐观 并 发 策 
略 ， 通 俗 地 说 ， 就 是 先进 行 操作 ， 如 果 没 有 其 他 线程 争 用 共享 数据 ， 那 
操作 就 成 功 了 ; 如果 共享 数据 有 争 用 ， 产 生 了 冲突 ， 那 就 再 采取 其 他 的 
补偿 措施 (最 常见 的 补偿 措施 就 是 不 断 地 重 试 ， 直 到 成 功 为 止 》， 这 种 
乐观 的 并 发 策略 的 许多 实现 都 不 需要 把 线程 挂 起 ， 因 此 这 种 同步 操作 称 
为 非 阻 塞 同步 (Non-Blocking Synchronization ) 。 











为 什么 笔者 说 使 用 乐观 并 发 策略 需要 “ 便 件 指令 集 的 发 展 ” 才 能 进行 
呢 ? 因 为 我 们 需要 操作 和 冲突 检测 这 两 个 步骤 具备 原子 性 ， 菲 什么 来 保 
证 呢 ? 如 果 这 里 再 使 用 互 斥 同步 来 保证 束 失 去 意义 了 ， 所 以 我 们 只 能 靠 
硬件 来 完成 这 件 事情 ， 硬 件 保 证 一 个 从 语义 上 看 起 来 需要 多 次 操作 的 行 
为 只 通过 一 条 处 理 器 指令 就 能 完成 ， 这 类 指令 闻 用 的 有 : 








测试 并 设置 (Test-and-Set) 。 


获取 并 增加 (Fetch-and-Increment) 。 


交换 (Swap) 。 
比较 并 交换 (Compare-and-Swap， 下 文 称 CAS) 。 


加 载 链接 /条 件 存储 (Load-Linked/Store-Conditional， 下 文 称 
LL/SC) 。 





其 中 ， 前 面 的 3 条 是 20 世 纪 就 已 经 存在 于 大 多 数 指 令 集 之 中 的 处 理 
器 指令 ， 后 面 的 两 条 是 现代 处 理 器 新 增 的 ， 而 且 这 两 条 指令 的 目的 和 功 
能 是 类 似 的 。 在 IA64、x86 指 令 集 中 有 cmpxchg 指 令 完 成 CAS 功 能 ， 在 


sparc-TSO 也 有 casa 指 令 实 现 ， 而 在 ARM 和 PowerPC 染 构 下 ， 则 需要 使 用 





一 对 ]drex/strex 指 令 来 完成 LL/SC 的 功能 。 


CAS 指 令 需 要 有 3 个 操作 数 ， 分 别 是 内 存 位 置 《在 Java 中 可 以 简单 
理解 为 变量 的 内 存 地 址 ， 用 V 表 示 ) 、 旧 的 预期 值 《 用 A 表 示 ) 和 新 值 
用 B 表 示 ) 。CAS 指 令 执行 时 ， 当 且 仅 当 V 符 合 旧 预期 值 A 时 ， 处 理 需 
用 新 值 B 更 新 V 的 值 ， 人 否则 它 就 不 执行 更 新 ， 但 是 无 论 是 否 更 新 了 V 的 
值 ， 都 会 返回 V 的 旧 值 ， 上 述 的 处 理 过 程 是 一 个 原子 操作 。 

















在 JDK 1.5 之 后 ，Java 程 序 中 才 可 以 使 用 CAS 操 作 ， 该 操作 由 
sun.misc.Unsafe 类 里 面 的 compareAndSwapInt() 和 compareAndSwapLong() 
等 几 个 方法 包装 提供 ， 虚 拟 机 在 内 部 对 这 些 方法 做 了 特殊 处 理 ， 即 时 编 
译 出 来 的 结果 就 是 一 条 平台 相关 的 处 理 器 CAS 指 令 ， 没 有 方法 调用 的 过 
程 ， 或 者 可 以 认为 是 无 条 件 内 联 进去 了 中。 








由 于 Unsafe 类 不 是 提供 给 用 户 程 序 调用 的 类 (Unsafe.getUnsafe() 的 
代码 中 限制 了 只 有 启动 类 加 载 器 (Bootstrap ClassLoader) 加 载 的 Class 
才能 访问 它 ) ， 因 此 ， 如 果 不 采 用 反射 手段 ， 我 们 只 能 通过 其 他 的 Java 
API 来 间接 使 用 它 ， 如 J.U.C 包 里 面 的 整数 原子 类 ， 其 中 的 
compareAndSet() 和 getAndIncrement() 等 方法 都 使 用 了 Unsafe 类 的 CAS 操 
全 





我 们 不 妨 拿 一 段 在 第 12 章 中 没有 解决 的 问题 代码 来 看 看 如 何 使 用 
CAS 操 作 来 避免 阻塞 同步 ， 代 码 如 代码 清单 12-1 所 示 。 我 们 曾经 通过 这 
段 20 个 线程 自 增 10000 次 的 代码 来 证 明 volatile 变 量 不 具备 原子 性 ， 那 么 
如 何 才 能 让 它 具 备 原子 性 呢 ? 把 "race++" 操 作 或 increase() 方 法 用 同步 块 
包 于 起 来 当然 是 一 个 办 法 ， 但 是 如 果 改 成 如 代码 清单 13-4 所 示 的 代码 ， 
那 效率 将 会 提高 许多 。 














代码 清单 13-4 _ Atomic 的 原子 自 增 运 算 





/** 
*Atomic 变 量 和 白 增 运算 测试 


大 























xQ@author zzm 

xs 

public class AtomicTest{ 
public static AtomicInteger race=new AtomicInteger (0) ; 
public static void increase() { 

race.incrementAndGet () ; 

} 

private static final int THREADS COUNT=20; 

public static void main (String[]args) throws Exceptiont{ 
Thread[]threads=new Thread [THREADS COUNT]; 

for (int i=0; i<THREADS COUNT; i++) { 

threads[i]=new Thread (new Runnaple(){ 






























































QOverride 

public void run(){ 

for (int 1=0; i<10000; i++) { 
ijncrease () ; 

} 

} 

}) ; 

threads[i].start(); 

} 

while (Thread.activeCount ()>1) 
Thread.yield ():; 

System.out .println (race) ; 

} 

} 











运行 结果 如 下 : 





200000 





使 用 AtomicInteger 代 蔡 int 后 ， 程 序 输出 了 正确 的 结果 ， 一 切 都 要 归 
功 于 incrementAndGet() 方 法 的 原子 性 。 它 的 实现 其 实 非常 简单 ， 如 代码 
清单 13-5 所 示 。 


代码 清单 13-5”incrementAndGet() 方 法 的 JDK 源 码 





/** 
*Atomically increment by one the current Value . 
*Qdreturn the updated value 








< 
public final int incrementAndGet (){ 
for (; ) { 





int current=get () ; 

int next=current+1l; 

if (compareAndSet (current,next) ) 
return next; 

















incrementAndGet(0) 方 法 在 一 个 无 限 循 环 中 ， 不 断 答 试 将 一 个 比 当前 
值 大 1 的 新 值 赋 给 自己 。 如 果 失 败 了 ， 那 说 明 在 执行 “获取 -设置 ”操作 的 
时 候 值 已 经 有 了 修改 ， 于 是 再 次 循环 进行 下 一 次 操作 ， 直 到 设置 成 功 为 
me 





尽管 CAS 看 起 来 很 美 ， 但 显然 这 种 操作 无 法 涵盖 互 斥 同步 的 所 有 使 
用 场景 ， 并 且 CAS 从 语义 上 来 说 并 不 是 完美 的 ， 存 在 这 样 的 一 个 逻辑 漏 
洞 : 如 果 一 个 变量 V 初 次 读 取 的 时 候 是 A 值 ， 并 且 在 准备 赋值 的 时 候 检 
查 到 它 仍然 为 A 值 ， 那 我 们 就 能 说 它 的 值 没 有 被 其 他 线程 改变 过 了 吗 ? 
如 果 在 这 段 期 间 它 的 值 曾经 被 改 成 了 B， 后 来 又 被 改 回 为 A， 那 CAS 操 
作 就 会 误 认 为 它 从 来 没有 被 改变 过 。 这 个 漏洞 称 为 CAS 操 作 的 "ABA" 问 
题 。J.U.C 包 为 了 解决 这 个 问题 ， 提 供 了 一 个 带 有 标记 的 原子 引用 
类 "AtomicStampedReference"， 它 可 以 通过 控制 变量 值 的 版 本 来 保证 
CAS 的 正确 性 。 不 过 目前 来 说 这 个 类 比较 “鸡肋 ”， 大 部 分 情况 下 ABA 问 
题 不 会 影响 程序 并 发 的 正确 性 ， 如 果 需 要 解决 ABA 问 题 ， 改 用 传统 的 互 
斥 同步 可 能 会 比 原子 类 更 高 效 。 














(Se) 


.无 同步 方案 





要 保证 线程 安全 ， 并 不 是 一 定 束 要 进行 同步 ， 两 者 没有 因果 关系 。 
同步 只 是 保证 共享 数据 争 用 时 的 正确 性 的 手段 ， 如 果 一 个 方法 本 来 妹 不 
涉及 共享 数据 ， 那 它 目 然 束 无 须 任何 同步 措施 去 保证 正确 性 ， 因 此 会 有 
一 些 代 码 天 生 就 是 线程 安全 的 ， 笔 者 简单 地 介绍 其 中 的 两 类 。 


可 重 入 代码 (Reentrant Code) : 这 种 代码 也 叫做 纯 代 码 (Pure 
Code) ， 可 以 在 代码 执行 的 任何 时 刻 中 断 它 ， 转 而 去 执行 另外 一 段 代 码 
(包括 递归 调用 它 本 身 ) ， 而 在 控制 权 返 回 后 ， 原 来 的 程序 不 会 出 现任 
何 错误 。 相 对 线程 安全 来 说 ， 可 重 入 性 是 更 基本 的 特性 ， 它 可 以 保证 线 
程 安全 ， 即 所 有 的 可 重 入 的 代码 都 是 线程 安全 的 ， 但 是 并 非 所 有 的 线程 
安全 的 代码 都 是 可 重 入 的 。 





可 重 入 代码 有 一 些 共同 的 特征 ， 例 如 不 依赖 存储 在 堆 上 的 数据 和 公 
用 的 系统 资源 、 用 到 的 状态 量 都 由 参数 中 传 入 、 不 调用 非 可 重 入 的 方法 
等 。 我 们 可 以 通过 一 个 简单 的 原则 来 判断 代码 是 否 具备 可 重 入 性 : 如 果 
一 个 方法 ， 它 的 返回 结果 是 可 以 预测 的 ， 只 要 输入 了 相同 的 数据 ， 束 部 
能 返回 相同 的 结束 ， 那 它 就 满足 可 重 入 性 的 要 求 ， 当 然 也 就 是 线程 安全 
的 。 





线程 本 地 存储 (Thread Local Storage) : 如 果 一 段 代 码 中 所 需要 的 
数据 必须 与 其 他 代码 共享 ， 那 残 看 看 这 些 共有 至 数据 的 代码 是 人 否 能 保证 在 
同一 个 线程 中 执行 ? 如 果 能 保证 ， 我 们 就 可 以 把 共 衬 数据 的 可 见 范围 限 
制 在 同一 个 线程 之 内 ， 这 样 ， 无 须 同步 也 能 保证 线程 之 间 不 出 现 数据 争 
用 的 问题 。 








符合 这 种 特点 的 应 用 并 不 少见 ， 大 部 分 使 用 消费 队列 的 架构 模式 
(如 “生产 者 -消费 者 ”模式 ) 都 会 将 产品 的 消费 过 程 义 量 在 一 个 线程 中 
消费 完 ， 其 中 最 重要 的 一 个 应 用 实例 束 是 经 典 Web 交 互 模型 中 的 “一 个 





请 求 对 应 一 个 服务 器 线程 ”(Thread-per-Request) 的 处 理 方式 ， 这 种 处 
理 方式 的 广泛 应 用 使 得 很 多 Web 服 务 端 应 用 都 可 以 使 用 线程 本 地 存储 来 
解决 线程 安全 问题 。 


Java 语 言 中 ， 如 果 一 个 变量 要 被 多 线程 访问 ， 可 以 使 用 volatile 关 键 
字 声 明 它 为 “ 易 变 的 ?>; 如 果 一 个 变量 要 被 某 个 线程 独 享 ，Java 中 就 没有 
类 似 C++ 中 _ declspec (thread) 这 样 的 关键 字 ， 不 过 还 是 可 以 通过 
java.lang.ThreadLocal 类 来 实现 线程 本 地 存储 的 功能 。 每 一 个 线程 的 
Thread 对 象 中 都 有 一 个 ThreadLocalMap 对 象 ， 这 个 对 象 存储 了 一 组 以 
ThreadLocal.threadLocalHashCode 为 键 ， 以 本 地 线程 变量 为 值 的 K-V 值 
对 ，ThreadLocal 对 象 就 是 当前 线程 的 ThreadLocalMap 的 访问 入 口 ， 每 一 
个 ThreadLocal 对 象 都 包含 了 一 个 独一无二 的 threadLocalHashCode 值 ， 使 
用 这 个 值 就 可 以 在 线程 K-V 值 对 中 找 回 对 应 的 本 地 线程 变量 。 








[1 本 例 中 的 数据 及 图 片 来 源 于 Brian Goetz 为 IBM developefYWotks 撰 写 的 论 
文 : 《Java theoty and practice:More flexible,scalable locking in JDK 5.0> ， 
原文 地 址 是 : http://www.ibm.com/developerworks/java/library/j- 
jtp10264/?S_TACT=105AGX52&S_CMP=cn-a-j。 

四 这 种 被 虚拟 机 特殊 处 理 的 方法 称 为 加 有 有 函数 (Inttinsics) ， 类 似 的 
有 函数 还 有 Math.sin0 等 。 

[3] 在 Visual C++ 中 是 "declspec (thread) "关键 字 ， 而 在 GCC 中 


加 


是 "_ thread"。 


13.3” 锁 优化 


高 效 并 发 是 从 JDK 1.5 到 JDK 1.6 的 一 个 重要 改进 ，HotSpot 虚 拟 机 开 
发 团队 在 这 个 版 本 上 花费 了 大 量 的 精力 去 实现 各 种 锁 优 化 技术 ， 如 适应 
性 自 旋 〈Adaptive Spinning) 、 锁 消除 (Lock Elimination ) 、 锁 粗 化 
(Lock Coarsening) 、 轻 量 级 锁 〈Lightweight Locking) 和 偏向 锁 
(Biased Locking) 等 ， 这 些 技术 都 是 为 了 在 线程 之 间 更 高 效 地 共享 数 
据 ， 以 及 解决 竞争 问题 ， 从 而 提高 程序 的 执行 效率 。 





13.3.1 目 旋 锁 与 目 适 应 目 旋 


前 面 我 们 讨论 互 斥 同步 的 时 候 ， 提 到 了 互 斥 同步 对 性 能 最 大 的 影响 
征 阻塞 的 实现 ， 挂 起 线程 和 恢复 线程 的 操作 都 需要 转 入 内 核 态 中 完成 ， 
这 些 操作 给 系统 的 并 发 性 能 带 来 了 很 大 的 压力 。 同 时 ， 虚 拟 机 的 开发 团 
队 也 注意 到 在 许多 应 用 上 ， 共 至 数据 的 锁定 状态 只 会 持续 很 短 的 一 段 时 
间 ， 为 了 这 段 时 间 去 挂 起 和 恢复 线程 并 不 值得 。 如 宋 物 理 机 器 有 一 个 以 
上 的 处 理 咒 ， 能 让 两 个 或 以 上 的 线程 同时 并 行 执行 ， 我 们 就 可 以 让 后 面 
请 求 锁 的 那个 线程 “ 稍 等 一 下 "”， 但 不 放 茎 处 理 器 的 执行 时 间 ， 看 看 持 有 
锁 的 线程 是 否 很 快 整 会 释放 锁 。 为 了 让 线程 等 每 ， 我 们 只 需 让 线程 执行 
一 个 忙 循环 〈 自 旋 ) ， 这 项 技术 束 是 所 请 的 自 旋 锁 。 

















自 旋 锁 在 JDK 1.4.2 中 就 已 经 引入 ， 只 不 过 默认 是 关闭 的 ， 可 以 使 
用 -XX:+UseSpinning 参 数 来 开启 ， 在 JDK 1.6 中 就 已 经 改 为 默认 开启 了 。 
自 旋 等 待 不 能 代 蔡 阻塞 ， 且 先 不 说 对 处 理 器 数量 的 要 求 ， 自 旋 等 待 本 身 
虽然 避免 了 线程 切换 的 开销 ， 但 它 是 要 占用 处 理 器 时 间 的 ， 因 此 ， 如 果 
锁 被 占用 的 时 间 很 短 ， 自 旋 等 待 的 效果 就 会 非常 好 ， 反 之 ， 如 果 锁 被 占 
用 的 时 间 很 长 ， 那 么 自 旋 的 线程 只 会 白白 消耗 处 理 器 资源 ， 而 不 会 做 任 
何 有 用 的 工作 ， 反 而 会 带 来 性 能 上 的 浪费 。 因 此 ， 自 旋 等 待 的 时 间 必 须 
要 有 一 定 的 限度 ， 如 果 自 旋 超 过 了 限定 的 次 数 仍然 没有 成 功 获得 锁 ， 就 
应 当 使 用 传统 的 方式 去 挂 起 线程 了 。 自 旋 次 数 的 默认 值 是 10 次 ， 用 户 可 
以 使 用 参数 -XX:PreBlockSpin 来 更 改 。 





在 JDK 1.6 中 引入 了 目 适 应 的 目 旋 锁 。 目 适应 意味 着 目 旋 的 时 间 不 
再 固定 了 ， 而 是 由 前 一 次 在 同一 个 锁 上 的 目 旋 时 间 及 锁 的 拥有 者 的 状态 
来 决定 。 如 果 在 同一 个 锁 对 象 上 ， 目 旋 等 竺 刚刚 成 功 获得 过 锁 ， 并 且 持 
有 锁 的 线程 正在 运行 中 ， 那 么 虚拟 机 融会 认为 这 次 目 旋 也 很 有 可 能 再 次 
成 功 ， 进 而 它 将 允许 目 旋 等 竺 持续 相 对 更 长 的 时 间 ， 比 如 100 个 循环 。 
另外 ， 如 宋 对 于 茶 个 锁 ， 目 旋 很 少 成 功 获得 过 ， 那 在 以 后 要 获取 这 个 锁 
时 将 可 能 省 略 掉 上 自 旋 过 程 ， 以 避免 浪费 处 理 器 资源 。 有 了 自 适 应 上 自 旋 ， 
随 看 程序 运行 和 性 能 监控 信息 的 不 断 完善 ， 虚 拟 机 对 程序 锁 的 状况 预测 
就 会 越 来 越 准 确 ， 虚 拟 机 就 会 变 得 越 来 越 “ 聪 明 ” 了 。 














13.3.2” 锁 消除 


锁 消 除 是 指 虚拟 机 即时 编译 器 在 运行 时 ， 对 一 些 代 码 上 要 求 同 步 ， 
但 是 被 检测 到 不 可 能 存在 共 孚 数据 竞争 的 锁 进 行 消除 。 锁 消除 的 主要 判 
定 依据 来 源 于 逃逸 分 析 的 数据 文 持 《〈 人 第 11 章 已 经 讲解 过 逃逸 分 析 拉 
术 ) ， 如 果 判 断 在 一 段 代 码 中 ， 扒 上 的 所 有 数据 都 不 会 逃逸 出 去 从 而 被 
其 他 线程 访问 到 ， 那 就 可 以 把 它们 当做 栈 上 数据 对 待 ， 认 为 它们 是 线程 
私有 的 ， 同 步 加 锁 目 然 就 无 须 进 行 。 











也 许 读者 会 有 疑问 ， 变 量 是 否 逃 逸 ， 对 于 虚拟 机 来 说 需要 使 用 数据 
流 分 析 来 确定 ， 但 是 程序 员 自己 应 该 是 很 清楚 的 ， 怎 么 会 在 明知 道 不 存 
在 数据 争 用 的 情况 下 要 求 同 步 呢 ? 答案 是 有 许多 同步 措施 并 不 是 程序 员 
目 己 加 入 的 ， 同 步 的 代码 在 Java 程 序 中 的 普 遇 程度 也 许 超过 了 大 部 分 读 
者 的 想象 。 我 们 来 看 看 代码 清单 13-6 中 的 例子 ， 这 段 非常 简单 的 代码 仅 
仅 是 输出 3 个 字符 串 相 加 的 结 末 ， 无 论 是 源码 字面 上 还 是 程序 语义 上 都 
没有 同步 。 























代码 清单 13-6 一 段 看 起 来 没有 同步 的 代码 


public String concatString (String sl, String s2, String s3) 1 
return sl+s2+s3; 


} 





我 们 也 知道 ， 由 于 String 是 一 个 不 可 变 的 类 ， 对 字符 串 的 连接 操作 
总 是 通过 生成 新 的 String 对 象 来 进行 的 ， 因 此 Javac 编 译 器 会 对 String 连 接 
做 自动 优化 。 在 JDK 1.5 之 前 ， 会 转化 为 StringBuffer 对 象 的 连续 append() 
操作 ， 在 JDK 1.5 及 以 后 的 版 本 中 ， 会 转化 为 StringBuilder 对 象 的 连续 
appendO 操 作 ， 即 代码 清单 13-6 中 的 代码 可 能 会 变 成 代码 清单 13-7 的 样 
= 





代码 清单 13-7 Javac 转 化 后 的 字符 串 连 接 操 作 





public String concatString (String sl, String s2, String s3) 1 
StringBuffer sb=new StringBuffer () ; 

sb.append (s1) ; 

sb.append (s2) ; 

sb.append (s3) ; 

return sb.toStrindg () ; 


} 









































现在 大 家 还 认为 这 段 代码 没有 涉及 同步 吗 ? 每 个 
StringBuffer.append() 方 法 中 都 有 一 个 同步 块 ， 锁 就 是 sb 对 象 。 虚 拟 机 观 
察 变量 sb， 很 快 就 会 发 现 它 的 动态 作用 域 被 限制 在 concatString() 方 法 内 
部 。 也 就 是 说 ，sb 的 所 有 引用 永远 不 会 “逃逸 "到 concatString() 方 法 之 
外 ， 其 他 线程 无 法 访问 到 它 ， 因 此 ， 虽 然 这 里 有 锁 ， 但 是 可 以 被 安全 地 
消除 掉 ， 在 即时 编译 之 后 ， 这 段 代 码 就 会 忽略 掉 所 有 的 同步 而 直接 执行 
J 





[1 客观 地 说 ， 既 然 谈 到 锁 消 除 与 逃 选 分 析 ， 那 虚拟 机 就 不 可 能 是 JDK 


1.5 之 前 的 版 本 ， 实 际 上 会 转化 为 非 线 程 安全 的 StringBuildef 来 完成 字符 
串 拼 接 ， 并 不 会 加 锁 ， 但 这 也 不 影响 笔者 用 这 个 例子 证 明 Java 对 象 中 同 


步 的 普遍 性 。 


13.3.3” 锁 粗 化 


原则 上 ， 我 们 在 编写 代码 的 时 候 ， 总 是 推荐 将 同步 块 的 作用 范围 限 





制 得 尽量 小 一 一 只 在 共有 至 数 据 的 实际 作用 域 中 才 进 行 同步 ， 这 样 是 为 了 
使 得 需要 同步 的 操作 数量 尽 可 能 变 小 ， 如 果 存 在 锁 范 争 ， 那 等 待 锁 的 线 
程 也 能 尽快 拿 到 锁 。 





大 部 分 情况 下 ， 上 面 的 原则 都 是 正确 的 ， 但 是 如 果 一 系列 的 连续 操 
作 都 对 同一 个 对 象 反 复 加 锁 和 人 解锁， 甚至 加 锁 操 作 是 出 现在 循环 体 中 
的 ， 那 即使 没有 线程 竞争 ， 频 营地 进行 互 斥 同步 操作 也 会 导致 不 必要 的 
性 能 损耗 。 





代码 清单 13-7 中 连续 的 append() 方 法 就 属于 这 类 情况 。 如 果 虚 拟 机 
探 汕 到 有 这 样 一 串 零碎 的 操作 都 对 同一 个 对 象 加 锁 ， 将 会 把 加 锁 同 步 的 
范围 扩展 〈 粗 化 ) 到 整个 操作 序列 的 外 部 ， 以 代码 清单 13-7 为 例 ， 就 是 
扩展 到 第 一 个 appendO 操 作 之 前 直至 最 后 一 个 append0 操 作 之 后 ， 这 样 只 

要 加 锁 一 次 就 可 以 了 。 


13.3.4 轻 量 级 锁 


轻 量 级 锁 是 JDK 1.6 之 中 加 入 的 新 型 锁 机 制 ， 它 名 字 中 的 “ 轻 量 
级 ”是 相对 于 使 用 操作 系统 互 斥 量 来 实现 的 传统 锁 而 言 的 ， 因 此 传统 的 
锁 机 制 就 称 为 “重量 级 ” 锁 。 首 先 需 要 强调 一 点 的 是 ， 轻 量 级 锁 并 不 是 用 
来 代 答 重量 级 锁 的 ， 它 的 本 意 是 在 没有 多 线程 竞争 的 前 担 下， 减少 传统 
的 重量 级 锁 使 用 操作 系统 互 斥 量 产生 的 性 能 消耗 。 











要 理解 轻 量 级 锁 ， 以 及 后 面 会 讲 到 的 偏向 锁 的 原理 和 运作 过 程 ， 必 
须 从 HotSpot 虚 拟 机 的 对 象 〈 对 象 头 部 分 ) 的 内 存 布局 开始 介绍 。 
HotSpot 虚 拟 机 的 对 象 头 《Object Header) 分 为 两 部 分 信息 ， 第 一 部 分 用 
于 存储 对 象 自身 的 运行 时 数据 ， 如 哈 希 码 〈HashCode) 、GC 分 代 年 龄 
(Generational GC Age) 每 ， 这 部 分 数据 的 长 度 在 32 位 和 64 位 的 虚拟 机 
中 分 别 为 32bit 和 64bit， 官 方 称 它 为 "Mark Word"， 它 是 实现 轻 量 级 锁 和 
偏向 锁 的 关键 。 另 外 一 部 分 用 于 存储 指向 方法 区 对 象 类 型 数据 的 指针 ， 
如 果 是 数组 对 象 的话 ， 还 会 有 一 个 额外 的 部 分 用 于 存储 数组 长 度 。 











对 象 尖 信息 是 与 对 象 自 喘 定义 的 数据 无 关 的 额外 存储 成 本 ， 考 虑 到 
虚拟 机 的 空间 效率 ，Mark Word 被 设计 成 一 个 非 固 定 的 数据 结构 以 便 在 
极 小 的 空间 内 存储 尽量 多 的 信息 ， 它 会 根据 对 象 的 状态 复 用 自己 的 存储 
空间 。 例 如 ， 在 32 位 的 HotSpot 虚 拟 机 中 对 象 未 被 锁定 的 状态 下 ，Mark 








Word 的 32bit 空 间 中 的 25bit 用 于 存储 对 象 哈 希 码 (HashCode) ，4bit 用 于 
存储 对 象 分 代 年 龄 ，2bit 用 于 存储 锁 标 志 位 ，1bit 固 定 为 0， 在 其 他 状态 

( 轻 量 级 锁定 、 重 量 级 锁定 、GC 标 记 、 可 偏向 〉 下 对 象 的 存储 内 容 见 
表 13-1。 





表 13-1 HotSpot 虚拟 机 对 象 头 Mark Word 





存储 内 容 标志 位 状态 
对 象 哈 希 码 、 对 象 分 代 年 龄 01 未 锁定 
指向 锁 记 录 的 指针 00 轻 量 级 锁定 
指向 重量 级 锁 的 指针 10 膨胀 《重量 级 锁定 ) 
空 ， 不 需要 记录 信息 11 GC 标记 
偏向 线程 ID、 偏 向 时 间 惟 、 对 象 分 代 年 龄 01 可 偏 问 








简单 地 介绍 了 对 象 的 内 存 布局 后 ， 我 们 把 话题 返回 到 轻 量 级 锁 的 执 
行 过 程 上 。 在 代码 进入 同步 块 的 时 候 ， 如 果 此 同步 对 象 没有 被 锁定 〈 锁 
标志 位 为 “01? 状 态 ) ， 虚 拟 机 首先 将 在 当前 线程 的 栈 帧 中 建立 一 个 名 为 
锁 记 录 〈Lock Record) 的 空间 ， 用 于 存储 锁 对 象 目前 的 Mark Word 的 找 
贝 〈 官 方 把 这 份 拷贝 加 了 一 个 Displaced 前 绥 ， 即 Displaced Mark 
Word) ， 这 时 候 线程 堆栈 与 对 象 头 的 状态 如 图 13-3 所 示 。 





然后 ， 虚 拟 机 将 使 用 CAS 操 作 党 试 将 对 象 的 Mark Word 更 新 为 指向 
Lock Record 的 指针 。 如 果 这 个 更 新 动作 成 功 了 ， 那 么 这 个 线程 就 拥有 了 
该 对 象 的 锁 ， 并 且 对 象 Mark Word 的 锁 标 志 位 〈Mark Word 的 最 后 2bit) 
将 转变 为 “00”， 即 表示 此 对 象 处 于 轻 量 级 锁定 状态 ， 这 时 候 线程 堆栈 与 
对 象 头 的 状态 如 图 13-4 所 示 。 
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图 13-3 轻 量 级 锁 CAS 操 作 之 前 堆栈 与 对 象 的 状态 上 
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图 13-4 轻 量 级 锁 CAS 操 作 之 后 堆栈 与 对 象 的 状态 


如 末 这 个 更 新 操作 失败 了 ， 虚 拟 机 首先 会 检查 对 象 的 Mark Word 是 
个 指 回 当 前 线程 的 栈 帧 ， 如 果 只 说 明 当 前 线程 已 经 拥有 了 这 个 对 象 的 
锁 ， 那 束 可 以 直接 进入 同步 块 继续 执行 ， 否 则 说 明 这 个 锁 对 象 已 经 被 其 


他 线程 抢占 了 。 如 果 有 两 条 以 上 的 线程 争 用 同一 个 锁 ， 


那 轻 量 级 锁 就 不 


再 有 效 ， 要 膨胀 为 重量 级 锁 ， 钞 标志 的 状态 值 变 为 "10”，Mark Word 中 
存储 的 就 是 指向 重量 级 锁 〈 互 斥 量 ) 的 指针 ， 后 面 等 待 锁 的 线程 也 要 进 








入 阻塞 状态 。 


上 面 描述 的 是 轻 量 级 锁 的 加 锁 过 程 ， 它 的 解锁 过 程 也 是 通过 CAS 操 
作 来 进行 的 ， 如 果 对 象 的 Mark Word 仍 然 指 向 着 线程 的 锁 记 录 ， 那 就 用 
CAS 操 作 把 对 象 当 前 的 Mark Word 和 线程 中 复制 的 Displaced Mark Word 
蔡 换 回来 ， 如 果 蔡 换 成 功 ， 整 个 同步 过 程 就 完成 了 。 如 果 蔡 换 失 败 ， 说 
明 有 其 他 线程 尝试 过 获取 该 锁 ， 那 就 要 在 释放 锁 的 同时 ， 唤 醒 被 挂 起 的 
线程 。 


轻 量 级 锁 能 提升 程序 同步 性 能 的 依据 是 “对 于 绝 大 部 分 的 锁 ， 在 整 
个 同步 周期 内 都 是 不 存在 竞争 的 ”， 这 是 一 个 经 验 数据 。 如 宁 没 有 苋 
争 ， 轻 量 级 锁 使 用 CAS 操 作 避 免 了 使 用 互 斥 量 的 开销 ， 但 如 果 存 在 锁 竞 
争 ， 除 了 互 斥 量 的 开销 外 ， 还 额外 发 生 了 CAS 操 作 ， 因 此 在 有 竞争 的 情 
况 下 ， 轻 量 级 锁 会 比 传统 的 重量 级 锁 更 慢 。 





[1 图 13-3 和 图 13-4 来 源 于 HotSpot 虚 拟 机 的 一 位 Senior Staff Engineer 





Paul Hohensee 所 写 的 PPT"The Hotspot Java Virtual Machine"。 


13.3.5” 偏 问 锁 


偏 回 锁 也 是 JDK 1.6 中 引入 的 一 项 锁 优 化 ， 它 的 目的 古 消 除数 据 在 
无 竞争 情况 下 的 同步 原 语 ， 进 一 步 提 高 程序 的 运行 性 能 。 如 果 说 轻 量 级 
锁 是 在 无 竞争 的 情况 下 使 用 CAS 操 作 去 消除 同步 使 用 的 互 太 量 ， 那 侦 同 
锁 就 是 在 无 竞争 的 情况 下 把 整个 同步 都 消除 反 ， 连 CAS 操 作者 不 做 了 。 











偏向 锁 的 “ 偏 "， 就 是 偏心 的 “ 偏 "、 偏 祖 的 “ 偏 "， 它 的 意思 是 这 个 锁 
会 偏 回 于 第 一 个 获得 它 的 线程 ， 如 末 在 接 下 来 的 执行 过 程 中 ， 该 锁 没有 
被 其 他 的 线程 获取 ， 则 持 有 偶 癌 锁 的 线程 将 永远 不 需要 再 进行 同步 。 





如 果 读 者 读 懂 了 前 面 轻 量 级 锁 中 关于 对 象 头 Mark Word 与 线程 之 间 
的 操作 过 程 ， 那 侦 向 锁 0 的 原理 理解 起 来 就 会 很 简单 。 假 设 当前 虚拟 机 局 
用 了 偏向 锁 〈 启 用 参数 -XX:+UseBiasedLocking， 这 是 JDK 1.6 的 默认 
值 ) ， 那 么 ， 当 锁 对 象 第 一 次 被 线程 获取 的 时 候 ， 虚 拟 机 将 会 把 对 象 头 
中 的 标志 位 设 为 “01”， 即 偏向 模式 。 同 时 使 用 CAS 操 作 把 获取 到 这 个 锁 
的 线程 的 人 D 记 录 在 对 象 的 Mark Word 之 中 ， 如 果 CAS 操 作成 功 ， 持 有 偏 
向 锁 的 线程 以 后 每 次 进入 这 个 锁 相 关 的 同步 块 时 ， 虚 拟 机 都 可 以 不 再 进 
行 任何 同步 操作 (例如 Locking、Unlocking 及 对 Mark Word 的 Update 


Ss 











当 有 男 外 一 个 线程 去 尝试 获取 这 个 锁 时 ， 偏 加 模式 束 宣 告 结束 。 根 








据 锁 对 象 目 前 是 否 处 于 被 锁定 的 状态 ， 撤 销 偏向 〈Revoke Bias) 后 恢复 
到 未 锁定 (标志 位 为 “01”) 或 轻 量 级 锁定 (标志 位 为 “00”) 的 状态 ， 后 
续 的 同步 操作 就 如 上 面 介 绍 的 轻 量 级 锁 那 样 执行 。 偏 向 锁 、 轻 量 级 锁 的 
状态 转化 及 对 象 Mark Word 的 关系 如 图 13-5 所 示 。 


































分 配对 象 
如 果 偏 向 锁 可 用 如 果 偏 向 锁 不 可 用 
0 epoch | age [ol| hash code | age oo 
未 锁定 、 未 偏向 但 是 可 偏向 的 对 象 人 未 被 锁定 的 ， 不 可 偏向 对 象 
ea a 调 Ex sa 滋 归 尔 室 
Wikis | am 撤销 偏向 轻 量 级 锁定 递归 锁定 


WS 
thread ID | epoch | age |1|01| pointer to lock record 00 


已 偏向 的 、 锁 定 或 未 锁定 的 对 象 被 轻 量 级 锁定 的 对 象 


ge 膨胀 
锁定 /解锁 






如 果 对 象 已 锁定 


pointer to heavyweight monitor 
被 重量 级 锁定 的 对 象 


图 13-5 偏向 锁 、 轻 量 级 锁 的 状态 转化 及 对 象 Matk Word 的 关系 








偏 同 锁 可 以 提高 带 有 同步 但 无 竞争 的 程序 性 能 。 它 同样 是 一 个 带 有 
效益 权衡 (Trade Off) 性 质 的 优化 ， 也 就 是 说 ， 它 并 不 一 定 总 是 对 程序 
运行 有 利 ， 如 果 程 序 中 大 多 数 的 锁 总 是 被 多 个 不 同 的 线程 访问 ， 那 偏向 
模式 就 是 多 余 的 。 在 具体 问题 具体 分 析 的 前 提 下 ， 有 时 候 使 用 参数 - 
XX:-UseBiasedLocking 来 禁止 偏 问 锁 优 化 反而 可 以 提升 性 能 。 











13.4 本章 小 结 





本 章 介 绍 了 线程 安全 所 涉及 的 概念 和 分 类 、 同 步 实现 的 方式 及 虚拟 
机 的 撒 层 运作 原理 ， 并 且 介 绍 了 虚拟 机 为 了 实现 高 效 并 发 所 采取 的 一 系 
列 锁 优 化 措施 。 





许多 资深 的 程序 员 都 说 过 ， 能 够 写 出 高 伸缩 性 的 并 发 程序 是 一 门 艺 
术 ， 而 了 解 并 发 在 系统 底层 是 如 何 实现 的 ， 则 是 掌握 这 门 艺术 的 前 提 条 
件 ， 也 是 成 长 为 高 级 程序 员 的 必 备 知识 之 一 。 
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附录 A ”编译 Windows 版 的 OpenJDK 


A.1 获取 JDK 源 码 


首先 确定 要 使 用 的 JDK 版 本 ，OpenJDK 6 和 OpenJDK 7 都 是 开源 
的 ， 源 码 都 可 以 在 它们 的 主页 (http://openjdk.java.net/〉 上 找到 ， 
OpenJDK 6 的 源码 其 实 是 从 OpenJDK 7 的 某 个 基线 中 引出 的 ， 然 后 剥离 
掉 JDK 1.7 相 关 的 代码 ， 从 而 得 到 一 份 可 以 通过 TCK 6 的 JDK 1.6 实 现 ， 
因此 直接 编译 OpenJDK 7 会 更 加 “ 原 汁 原味 ”一 些 ， 其 实 这 两 个 版 本 的 编 
译 过 程 差异 并 不 大 。 











获取 源码 有 两 种 方式 。 一 种 是 通过 Mercurial 代 码 版 本 管理 工具 从 
Repository 中 直接 取得 源码 (Repository 地 址 : 
http://hg.openjdk.java.net/jdk7/jdk7) ， 这 是 最 直接 的 方式 ， 从 版 本 管理 
中 看 变更 轨迹 比 看 什么 Release Note 都 来 得 实在 ， 不 过 坏处 自然 是 太 麻 
烦 了 一 些 ， 尤 其 是 Mercurial 远 不 如 SVN、ClearCase 或 CVS 之 类 的 版 本 控 
制 工 具 那 样 普及 。 男 一 种 就 是 直接 下 载 官方 打包 好 的 源码 包 了 ， 可 以 从 
Source Releases 页 面 〈 地 址 : http://download.java.net/openjdk/jdk7/〉 取 得 
打包 好 的 源码 ， 一 般 来 说 大 概 一 个 月 会 更 新 一 次 ， 虽 然 不 够 及 时 ， 但 的 
确 方 便 了 许多 。 笔 者 下 载 的 是 OpenJDK 7 Early Access Source Build b121 
版 ，2010 年 12 月 9 日 发 布 的 ， 大 概 81.7MB， 解 压 后 约 308MB。 








A.2 系统 需求 


如 果 可 能 ， 笔 者 建议 尽量 在 Linux 或 Solaris 上 构建 OpenJDK， 这 要 比 
在 Windows 平 台 上 轻松 许多 ， 而 且 网 络 上 能 找到 的 资料 绝 大 部 分 都 是 在 
Linux 上 编译 的 。 如 果 一 定 要 在 Windows 平 台 上 编译 ， 建 议 读者 认真 阅 
读 一 下 源码 中 的 README-builds.html 文 档 (无 论 在 OpenJDK 网 站 上 还 是 
在 下 载 的 源码 包 里 面 都 有 这 份 文档 ) ， 因 为 编译 过 程 中 需要 注意 的 细节 
非常 多 。 昌 然 不 至 于 像 文 档 上 所 描述 的 “Building the source code for the 


JDK requires a high level of technical expertise.Sun provides the source code 





primarily for technical experts who want to conduct research (编译 JDK 需 要 
很 高 的 专业 技术 ，Sun 提 供 JDK 源 码 是 为 了 技术 专家 进行 研究 之 用 ) " 那 
么 伪 张 ， 但 是 如 果 读 者 是 第 一 次 编译 ， 那 在 上 面 耗费 一 整 天 乃 全 更 多 的 
时 间 都 很 正常 。 





笔者 在 本 次 实战 中 演示 的 是 在 32 位 Windows 7 平台 下 编译 x86 版 的 
OpenJDK 〈 也 就 是 32 位 的 JDK) ， 如 果 需 要 编译 x64 版 ， 那 又 无 疑问 也 
需要 一 个 64 位 的 操作 系统 。 另 外 ， 编 译 涉及 的 所 有 文件 都 必须 存放 在 
NTEFS 格 式 的 文件 系统 中 ， 因 为 FAT32 格 式 无 法 支持 大 小 写 敏感 的 文件 
名 。 在 官方 义 档 上 写 着 : 编译 至 少 需要 512MB 的 内 存 和 600MB 的 磁盘 空 
间 。512MB 的 内 存 基 本 上 也 可 以 凑合 使 用 ， 不 过 600MB 的 磁盘 空间 仅仅 
是 指 存放 OpenJDK 源 码 和 相关 依赖 项 的 空间 ， 要 完成 编译 ，600MB 表 定 





是 无 论 如 何 都 不 够 的 ， 这 次 实战 中 所 下 载 的 工具 、 依 赖 项 、 源 码 ， 全 部 
安装 、 解 压 完成 最 少 (最少 是 指 只 下 载 C++ 编 译 器 ， 不 下 载 VS 的 IDE) 
需要 超过 1GB 的 空间 。 








对 系统 的 最 后 一 点 要 求 就 是 所 有 的 文件 ， 包 括 源码 和 依赖 项 目 ， 都 
不 要 放 在 包含 中 文 或 空格 的 目录 里 面 ， 这 样 做 不 是 一 定 不 可 以 ， 只 是 这 
样 会 为 后 续 建 六 CYGWIN 环 境 带 来 很 多 额外 的 工作 ， 这 是 由 于 Linux 和 
Windows 的 磁盘 路 径 差 别 所 导致 的 ， 我 们 也 没有 必要 给 自己 找 麻 烦 。 





A.3 构建 编译 环境 





准备 编译 环境 的 第 一 步 是 去 安装 一 个 CYGWINIH1。 这 是 一 个 在 
Windows 平 台 下 模拟 Linux 运 行 环境 的 软件 ， 提 供 了 一 系列 的 Linux 命 令 
文 持 。 需 要 CYGWIN 的 原因 是 在 编译 中 要 使 用 GNU Make 来 执行 
Makefile 文 件 〈C/C++ 程 序 员 肯 定 很 熟悉 ， 如 果 只 使 用 Java， 那 把 这 个 东 
西 当做 C++ 版 本 的 ANT 看 待 就 可 以 了 ) 。 安 装 CYGWIN 时 不 能 直接 默认 
安装 ， 因 为 表 A-1 中 所 示 的 工具 都 不 会 进行 默认 安装 ， 但 又 是 编译 过 程 
中 需要 的 ， 因 此 要 在 图 A-1 的 安装 界面 中 进行 手工 选择 。 


文件 名 
ar.exe 


make.exe 





表 A-1 需要 手工 选择 安装 的 CYGWIN 工具 


描述 
The GNU assembler, linker and binary utilities 


The GNU version of the ‘make’ utility built for CYGWIN. 





m4.exe 


9 类 | 包 | 
4 


Devel make 
Interpreters m 


GNU implementation of the traditional Unix macro processor 








cpio.exe Utils cpio A program to manage archives of fles 

+ 
gawk.exe Utils awk Pattern-directed scanning and processing language 
file.exe Utils file Determines file type using 'magic' numbers 


文件 名 
Zip.exe 
unzip.exe 


free.exe 





| | 





描述 
Package and compress (archive) files 
Extract compressed files in a ZIP archive 


Display amount of free and used memory in the system 


CYGWIN 安 装 时 的 定制 包 选 择 界面 如 图 A-1 所 示 : 


医 cymin Setup - Select Packages 


Select Packages 
Select packages to instal 


Search | 


Category 人 全 二 天 经 全 Package 
日 向 1I #7 Defsult 

因 Accessibility #7 Default 

日 Adain #¥ Default 





attr, Utilities for mar 
cron: Vixie’s cron. 
cygrunsrv; NT/YOK servi 
libattrl: Shared lib fe 
shutdown; Shutdown, ret 
syslogne:. Hoxt generat 
因 和 chive 入 Default 
上 





图 A-1 CYGWIN 安 装 界面 





建立 编译 环境 的 第 二 步 是 安装 编译 器 。JDK 中 最 核心 的 代码 (Java 
虚拟 机 及 JDK 中 Native 方 法 的 实现 等 ) 是 使 用 C++ 语言 及 少量 的 C 语 言 编 
写 的 ， 官 方 文档 中 说 他 们 的 内 部 开发 环境 是 在 Microsoft Visual Studio 
C++2003 (VS2003) 中 进行 编译 ， 同 时 也 在 Microsoft Visual Studio 
C++2010 (VS2010〉 中 测试 过 ， 所 以 最 好 只 选择 这 两 个 编译 絮 之 一 进行 
编译 。 如 果 选 择 VS2010， 那 么 在 编译 占 之 中 己 经 包含 了 Windows SDK v 
7.0a， 否 则 可 能 还 要 自己 去 下 载 这 个 SDK， 并 且 更 新 PlatformSDK 目 录 。 














由 于 Visual Studio 2010 的 IDE 是 收费 的 ， 所 以 仅仅 下 载 了 VS2010 Express 
中 提取 出 来 的 C++ 编译 占 ， 这 部 分 是 免费 的 ， 但 单独 安装 好 编译 堪 比 较 
及 焕 。 建 议 读者 选择 使 用 整套 Visual Studio C++2010 或 Visual Studio 


C++2010 Express 版 进行 编译 。 


需要 特别 注意 的 一 点 是 ，CYGWIN 和 VS2010 安 装 之 后 都 会 在 操作 
系统 的 PATH 环境 变量 中 写 入 自己 的 bin 目 录 路 径 ， 必 须 检 查 并 保证 
VS2010 的 bin 目 录 一 定 要 在 CYGWIN 的 bin 目 录 之 前 ， 因 为 这 两 个 软件 的 
bin 目 录 之 中 各 自 都 有 个 连接 器 "link.exe"， 但 是 只 有 VS2010 中 的 连接 器 
可 以 完成 OpenJDK 的 编译 。 

















准备 JDK 编 译 环境 的 第 三 步 就 是 下 载 一 个 已 经 编译 好 了 的 JDK。 这 
听 起 来 也 许 有 点 滑稽 必须 先 养 一 只 母 鸡 呀 ? 
但 仔细 想 想 其 实 这 个 步骤 很 合理 : 因为 JDK 包 含 的 各 个 部 分 〈Heotspot、 
JDK API、JAXWS、JAXP......) 有 的 是 使 用 C++ 编写 的 ， 而 更 多 的 代 
码 则 是 使 用 Java 自 身 实现 的 ， 因 此 编译 这 些 Java 代 码 需要 用 到 一 个 可 用 
的 JDK， 官 方 称 这 个 JDK 为 "Bootstrap JDK"。 而 编译 OpenJDK 7 的 话 ， 
Bootstrap JDK 必 须 使 用 JDK6 Update 14 或 之 后 的 版 本 ， 笔 者 选用 的 是 


JDK6 Update 21。 


乌 僵 入 




















最 后 一 个 步骤 是 下 载 一 个 Apache ANT,JDK 中 Java 代 码 部 分 都 是 使 
用 ANT 脚 本 进行 编译 的 ，ANT 版 本 要 求 在 1.6.5 以 上 ， 这 部 分 是 Java 的 基 
础 知识 ， 对 本 书 的 读者 来 说 应 该 没有 难度 ， 笔 者 不 再 详 述 








ICYGWIN 下 载 地 址 : http://www.cyewin.com/。 


A.4 准备 依赖 项 


前 面 说 过 ，OpenJDK 中 开放 的 源码 并 没有 达到 100%， 还 有 极 少 量 
的 无 法 开源 的 产权 代码 存在 。OpenJDK 承 诺 日 后 将 逐步 使 用 开源 实现 来 
蔡 换 掉 这 部 分 产权 代码 ， 但 至 少 在 今天 ， 编 译 JDK 还 需要 这 部 分 闭 源 
包 ， 官 方 称 之 为 "JDK Plug"t"， 它 们 从 前 面 的 Source Releases 页 面 就 可 以 
下 载 到 。 在 Windows 平 台 的 JDK Plug 是 以 Jar 包 的 形式 提供 的 ， 通 过 下 面 


这 条 命令 可 以 安装 它 : 








java-jar jdk-7-ea-plug-bl21-windows-i586-09 dec 2010.jar 








运行 后 将 会 显示 如 图 A-2 所 示 的 协议 ， 点 击 ACCEPT 接 受 协议 ， 然 
后 把 Plug 安装 到 指定 目录 即 可 。 安 装 完 毕 后 建立 一 个 环境 变 
量 "ALT_BINARY_ PLUGS_PATH"， 变 量 值 为 此 JDK Plug 的 安装 路 径 ， 
后 面 编 译 程序 时 需要 用 到 它 。 








除了 要 用 到 JDK Plug 外 ， 编 译 时 还 需要 引用 JDK 的 运行 时 包 ， 
是 编译 JDK 中 用 Java 代 码 编写 的 那 部 分 所 需要 的 ， 如 有 果 仅 仅 是 想 编译 一 
个 HotSpot 虚 拟 机 的 话 则 可 以 不 用 。 官 方 文档 把 这 部 分 称 为 "Optional 
Import JDK"， 可 以 直接 使 用 前 面 Bootstrap JDK 的 运行 时 包 ， 我 们 需要 建 
立 一 个 名 为 "ALT _JDK_IMPORT PATH" 的 环境 变量 指向 JDK 的 安装 目 
录 。 


Binary License for OpenJDK 
Sun Microsystems, inc Binary Code License Agreement 


SUN MICROSYSTEMS, INC. CSUNDJIS WILLING TO LICENSE THE SOFTWARE TO YOU 
IONLY UPON THE CONDITION THAT YOU ACCEPT ALL OF THE TERMS CONTAINED IN THIS 


BINARY CODE LICENSE AGREEMENT (AGREEMENT") PLEASE READ THE AGREEMENT 
ICAREFULLY. BY DOWNLOADING OR INSTALLING THIS SOFTWARE, YOU ACCEPT THE 
FULL 

TERMS OF THIS AGREEMENT. 








图 A-2 JDK Plug 安装 协议 





然后 是 安装 一 个 大 于 2.3 版 的 FreeTypel， 这 是 一 个 免费 的 字体 泻 染 
库 ，JDK 的 Swing 部 分 和 JConsole 这 类 工具 要 使 用 到 它 。 安 装 好 后 建立 两 
个 环境 变 
量 "ALT_FREETYPE_LIB_PATH" 和 "ALT_FREETYPE_HEADERS_PATH 
分 别 指向 FreeType 安 装 目录 下 的 bin 目 录 和 include 目 录 。 另 外 还 有 一 
方 文档 没有 提 到 但 必须 要 做 的 事情 是 把 FreeType 的 bin 目 录 加 入 到 PATH 
境 变量 中 。 


然后 下 载 Microsoft DirectX 9.0 SDK (Summer 2004) ， 安 装 后 大 约 
有 298MB， 在 微软 官方 网 站 上 搜索 一 下 束 可 以 找到 下 载 地址 ， 它 是 免费 
的 。 安 装 后 建立 环境 变量 "ALT_DXSDK_PATH" 指 向 DirectX 9.0 SDK 的 


安装 目录 。 


然后 去 寻找 一 个 名 为 "MSVCR100.DLL" 的 动态 链接 库 ， 如 果 读 者 在 
前 面 安 装 了 全 套 的 Visual Studio 2010， 奢 这 个 文件 在 本 机 就 能 找到 ， 否 
则 上 网 搜索 一 下 也 能 找到 单独 的 下 载 地 址 ， 大 概 有 744KB。 建 并 环境 变 
量 "ALT_MSVCRNN_DLL_PATH" 指 向 这 个 文件 所 在 的 目录 。 如 果 读 者 
选择 的 是 VS2003， 这 个 文件 名 应 当 为 "MSVCR73.DLL"， 应 该 在 很 多 软 
件 中 都 包含 有 这 个 文件 ， 如 果 找 不 到 的 话 ， 前 面 下 载 的 "Bootstrap 
JDK" 的 bin 目 录 中 应 该 也 有 一 个 ， 直 接 拿 来 用 吧 。 





四 在 2011 年 ，JDK plug 已 经 不 再 需要 了 ， 但 在 笔者 写本 次 实战 时 使 用 的 
2010 年 12 月 9 日 发 布 的 OpenJDK b121 版 还 是 需要 这 些 JDK plug。 


[2]FreeType 主 页 : http://www.freetype.org/。 


A.5 进行 编译 


现在 需要 下 载 的 编译 环境 和 依赖 项 目 都 准备 齐全 了 ， 最 后 我 们 还 需 
要 对 系统 做 一 些 设置 以 便 编译 能 够 顺利 通过 


首先 执行 VS2010 中 的 VCVARS32.BAT， 这 个 批 处 理 文件 的 目的 主 
要 是 设置 INCLUDE、LIB 和 PATH 这 几 个 环境 变量 ， 如 果 和 笔者 一 样 只 
是 下 载 了 编译 器 的 话 则 需要 手工 设置 它们 ， 各 个 环境 变量 的 设置 值 可 以 
参考 下 面 给 出 的 代码 清单 A-1 中 的 内 容 。 批 处 理 运 行 完 之 后 建 
"ALT_COMPILER_PATH'" 环 境 变量 让 Makefile 知 道 在 哪里 可 以 找到 编 


译 





SN 


I 


Bn 


再 建立 "ALT_BOOTDIR" 和 "ALT_JDK_IMPORT_PATH" 两 个 环境 变 
量 指向 前 面 提 到 的 JDK 1.6 的 安装 目录 。 建 立 "ANT_HOME" 指 向 Apache 
ANT 的 安装 目录 。 建 立 的 环境 变量 很 多 ， 为 了 避免 遗漏 ， 笔 者 写 了 一 个 
批 处 理 文件 以 供 读者 参考 ， 如 代码 清单 A-1 所 示 。 


代码 清单 A-1 环境 变量 设置 





SET ALT BOOTDIR=D:/ DevSpace/JDK 1.6.0 21 
SET ALT BINARY PLUGS PATH=D:/jdkBuild/jdk7plug/openjdk-binary- 




















SET ALT JDK IMPORT PATH=D:/ DevSpace/JDK 1.6.0 21 
SET ANT HOME=D:/jdkBuild/apache-ant-1.7.0 

SET ALT MSVCRNN DLL PATH=D:/jdkBuild/msvcr100 

SET ALT DXSDK PATH=D:/jdkBuild/msdxsdk 
































SET ALT_COMPILER_PATH=D:/JjJdkBuild/vcpp2010.x86/Pin 

SET ALT FREETYPE HEADERS PATH=D:/jdkBuild/freetype-2.3.5-1- 
bin/include 
SET ALT FREETYPE LIB PATH=D:/jdkBuild/freetype-2.3.5-1-bin/bin 
SET INCLUDE=D:/jdkBuild/vcpp2010.x86/include:; 
D:/jdkBuild/vcpp2010.x86/sdk/Include; %INCLUDES 

SET LIB=D:/jdkBuild/vcpp2010.x86/1ib; 
D:/jdkBuild/vcpp2010.x86/sdk/Lib; %$LIBS 

SET LIBPATH=D:/jdkBuild/vcpp2010.x86/1ib; SLIBS 

SET PATH=D:/jdkBuild/vcpp2010.x86/bin; 

D: /jdkBuild/vcpp2010.x86/d1ll/x86; D:/Software/OpenSource/cygwin/bin; 
SALT FREETYPE LIB PATHS; %PATHS 
















































































































































































最 后 还 需要 进行 两 项 调整 ， 虽 然 ， 官 方 文档 没有 说 明 这 两 项 ， 但 是 
必须 要 做 完 才 能 保证 编译 过 程 的 顺利 通过 : 是 取消 环境 变量 
JAVA_HOME， 这 点 很 简单 ， 另 外 一 项 是 尽量 在 英文 的 操作 系统 上 编 
译 ， 如 果 不 能 在 英文 的 系统 上 编译 就 把 系统 的 文字 格式 调整 为 “英语 
(美国 ) ”， 在 控制 面板 -区 域 和 语言 选项 的 第 一 个 页 签 中 可 以 设置 。 如 
果 这 个 设置 还 不 能 更 改 就 建立 一 个 "BUILD_CORBA" 的 环境 变量 ， 将 值 
设置 为 false， 取 消 编译 CORBA 部 分 ， 人 否则 Java IDL (idlj.exe〉 为 *.id] 文 
件 生成 CORBA 适 配器 代码 的 时 候 会 产生 中 文 注释 ， 而 这 些 中 文 注释 会 
因为 字符 集 的 问题 而 导致 编译 失败 。 








完成 了 上 述 的 准备 工作 之 后 ， 我 们 终于 可 以 开始 编译 了 。 进 入 控制 
台 《〈Cmd.exe) 后 运行 刚才 准备 好 的 设置 环境 变量 的 批 处 理 文件 ， 然 后 
输入 bash 进 入 Bourne Again Shell 环 境 (sh 或 ksh 也 可 以 ) 。 如 果 JDK 的 安 
装 源码 中 存在 "jdk_generic_profile.sh" 这 个 Shell 脚 本 ， 先 执行 它 ， 笔 者 下 
载 的 OpenJDK 7 B121 版 没有 这 个 文件 了 ， 所 以 直接 输入 make sanity 来 检 


碍 我 们 前 面 所 做 的 设置 是 侣 全 部 正确 。 如 采 一 切 顺 利 ， 那 么 几 秒 钟 之 后 
会 有 关 似 代码 清单 A-2 所 示 的 输出 。 


代码 清单 A-2 make sanity 检 查 





D:N\Jdki 





bash-3.2Smake sanity 
Cygwin warning: 
MS-DOS style path detected:C:/Windows/system32/wscript.exe 


Pret 





ferred POS] 





Build\openjdk7>bash 


[Xx equivalent 


is:/cygdrive/c/Windows/system32/wscript.exe 


CYGW] 





warning. 
Consult the user's guide 


ht 


FRE 


ALT “ 
OPENJDK Import 
BINARY PLUGS=t 
RFILE=D:/jdkBuild/jdk7plug/openjdk-binary- 
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FETYPE L 





ETYPE LIB PATH=D:/jdk 





pT 














IMPORT 
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ings 














[IN environment variable option"nodosfilewarning"turns off this 











for more details about POSIX paths: 
tp://cygwin.com/cygwin-ug-net/using.html#using-pathnames 

(cd./jdk/make&&\ 
因 篇 幅 关 系 ， 中 间 省 略 了 大 量 的 输出 内 容 .…. 
OPenUDK-sSpecii 
ETYPE HEADERS PATH=D:/jdkBuild/freetype-2.3.5-1-bin/include 
EETYPE HEADERS 


四 











PATH=D: /jdkBuild/freetype-2.3.5-1-bin/include 











Build/freetype-2.3.5-1-bin/bin 





























B PATH=D:/jdkBuild/freetype-2.3.5-1-bin/bin 
Binary 





Plug Settings: 
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Build/jdk7plug/openjdk-binary-plugs 

RY PLUGS PATH=D:/jdkBuild/jdk7plug/openjdk-binary-plugs 

区 UGS PATH=J:/re/jdk/1.7.0/promoted/latest/openjdk/bi 
BUILD BINARY PLUGS PATH= 
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PE=D:/ DevSpace/JDK 1.6.0 21 

















多 | 
OW OCONEE OO 

















MAG 


> 








Sanity check passed. 





Makefile 的 Sanity 检 查 过 程 输出 了 编译 所 需 的 所 有 环境 变量 ， 如 果 看 
到 "Sanity check passed."， 说 明 检 查 过 程 通过 了 ， 可 以 输入 "make" 执 行 整 
个 Makefile， 笔 者 使 用 Core i5/4GB RAM 的 机 器 编译 整个 JDK 大 概 需要 半 
个 多 小 时 。 如 果 失 败 则 需要 根据 系统 输出 的 失败 原因 ， 回 头 再 检查 一 下 
对 应 的 设置 。 并 且 最 好 在 下 一 次 编译 之 前 先 执行 "make clean" 来 清理 掉 
上 次 编译 遗留 的 文件 。 











编译 完成 之 后 ， 打 开 OpenJDK 源 码 下 的 build 目 录 ， 看 看 是 不 是 已 经 
有 一 个 编译 好 的 JDK 在 那里 等 着 了 ? 执行 一 下 "java-version"， 看 到 以 目 
己 机 器 命名 的 JDKJ 了 吧 ， 很 有 成 束 感 吧 ! 


附录 B 虚拟 机 字 市 码 指令 表 


字 节 码 
Ox00 
0x01 
0x02 
0x03 
0x04 
Ox05 
0x06 
0x07 
0x08 
0x09 
0x0a 
0x0b 
0x0c 
0x0d 
0x0e 
OxOf 
0x10 
Ox1l 
0x12 
Ox13 
Ox14 
0x15 
0x16 
0x17 
Oxl8 
0x19 
Oxla 
Oxlb 
Oxlc 
Oxld 
Oxle 
0x1f 


助 记 符 


aconst_null 


iconst ml 


iconst 1 
iconst 2 


iconst 3 


iconst 4 
iconst 5 
lconst 0 
lconst_ 1 
fconst 0 
fconst 1 
fconst 2 
dconst 0 


dconst 1 


sipush 
d 


人 


ldc_ w 


ldc2_w 


lload 
fload 
dload 


iload 1 
iload 2 
iload 3 
lload 0 


指令 含义 
什么 都 不 做 
将 null 推送 至 栈 项 
将 int 型 -1 推送 至 栈 顶 
将 int 型 0 推送 至 栈 项 
将 int 型 1 推送 至 栈 项 
将 int 型 2 推送 至 栈 顶 
将 int 型 3 推送 至 栈 顶 
将 int 型 4 推送 至 栈 顶 
将 int 型 5 推送 至 栈 顶 
将 long 型 0 推送 至 栈 顶 
将 long 型 1 推送 至 栈 顶 
将 float 型 0 推送 至 栈 顶 
将 float 型 1 推送 至 栈 顶 
将 float 型 2 推送 至 栈 顶 
将 double 型 0 推送 至 栈 顶 
将 double 型 1 推送 至 栈 顶 
将 单字 节 的 常量 值 (-128~127) 推送 至 栈 顶 
将 一 个 短 整 型 常量 值 (-32768~32767) 推送 至 栈 顶 
将 int、float 或 String 型 常量 值 从 常量 池 中 推送 至 栈 顶 


将 int、float 或 String 型 常量 值 从 常量 池 中 推送 至 栈 硕 ( 宽 索引 ) 


将 long 或 double 型 常量 值 从 常量 池 中 推送 至 栈 顶 〈 宽 索引 ) 
将 指定 的 int 型 本 地 变量 推送 至 栈 顶 
将 指定 的 long 型 本 地 变量 推送 至 栈 顶 
将 指定 的 float 型 本 地 变 基 推送 至 栈 顶 
将 指定 的 double 型 本 地 变量 排 送 至 栈 顶 
将 指定 的 引用 类 型 本 地 变量 推送 至 栈 顶 
将 第 一 个 int 型 本 地 变量 推送 至 栈 项 

将 第 二 个 int 型 本 地 变量 推送 至 栈 项 
将 第 三 个 int 型 本 地 变 綦 推送 至 栈 顶 
将 第 四 个 int 型 本 地 变量 推送 至 栈 顶 
将 第 一 个 long 型 本 地 变 其 推送 至 栈 顶 
将 第 二 个 long 型 本 地 变量 推送 至 栈 顶 


至 
廿 


| 又 | 到 
ps 


fioad 0 
fload | 
fioad 2 
fioad 3 
dload 0 
dload 1 
dload 2 
dload 3 
aload 0 
aload | 
aload 2 
aload 3 
iaload 
laload 
faload 
daload 


anload 


© 


caload 


fstore 


astore 


istore 2 


istore 3 


lstore 1 


lstore 3 


fstore 1 


指令 含义 
将 第 三 个 long 型 本 地 变 基 排 送 至 栈 项 
将 第 四 个 long 型 本 地 变革 排 送 至 栈 顶 
将 第 一 个 float 型 本 地 变 攻 排 送 到 栈 项 
将 第 二 个 float 型 本 地 变量 推送 至 栈 贷 
将 第 三 个 float 型 本 地 变量 排 送 至 栈 项 
将 第 四 个 foat 开本 地 变量 排 送 至 栈 项 
将 第 一 个 double 型 本 地 变量 推送 至 栈 顶 
将 第 二 个 double 型 本 地 变量 推送 至 栈 项 
将 第 三 个 double 型 本 地 变量 排 送 至 栈 项 
将 第 四 个 double 型 本 地 变 基 推送 至 栈 磺 
将 第 一 个 引用 类 型 本 地 变量 推送 至 栈 顶 
将 第 二 个 引用 类 型 本 地 变 其 推 送 至 栈 顶 
将 第 三 个 引用 类 型 订 地 变量 推送 至 栈 顶 
将 第 四 个 引用 类 型 林地 变量 锥 送 至 栈 项 
将 int 型 数组 指定 索引 的 值 推送 至 栈 顶 
将 long 型 数组 指定 索引 的 值 排 送 译 栈 顶 
将 Hoat 型 数组 指定 索引 的 值 推 送 至 栈 巴 


将 double 型 数组 指定 索引 的 值 排 送 至 栈 项 


将 引用 型 数组 指定 索引 的 值 推送 至 栈 顶 


将 boolean 或 byte 型 数组 指定 索引 的 值 排 送 至 栈 顶 


将 char 型 数组 指定 索引 的 值 排 送 至 栈 项 
将 short 增 数 组 指定 案 引 的 值 推送 到 栈 顶 
将 栈 顶 int 击 数 值 存 人 指定 本 地 变 基 

将 栈 项 long 型 数值 存 入 指定 本 地 变量 
将 栈 项 float 型 数值 在 人 指定 本 地 变量 
将 栈 顶 double 型 数值 存 人 指定 本 地 变 基 
将 栈 颈 引 几 型 数值 存 人 指定 本 地 变 其 
将 栈 顶 int 型 数值 存 人 第 一 个 本 地 变量 
将 栈 顶 int 型 数值 存 人 第 二 个 本 地 变量 
将 栈 顶 int 型 数值 存 人 第 三 个 本 地 变量 
将 栈 项 int 型 数值 存 人 第 四 个 本 地 变量 
将 乒 顶 long 型 数值 存 人 第 一 个 本 地 变 基 
将 栈 顶 long 型 数值 存 人 第 二 个 本 地 变量 
将 栈 顶 long 型 数值 存 人 第 三 个 本 地 变 基 
将 和 栈 项 long 型 数值 存 入 第 四 个 本 地 变量 
将 栈 珊 float 型 数值 存 人 第 一 个 本 地 变 基 
将 栈 顶 float 型 数值 存 人 第 二 个 本 地 变 基 
将 栈 项 float 型 数值 存 人 第 三 个 本 地 变 基 


( 续 ) 


Wo hs 
B 


记 


fstore 3 


奸 


dsiore 0 


dstore 2 
dstore 3 


astore 0 


astore 2 


fastore 
dastore 
nastore 


bastore 


dup_x2 


dup2 


fadd 
dadd 


fsub 


指令 含义 
将 我 项 float 型 数值 存 人 第 四 个 本 地 变量 
将 栈 项 double 型 数值 存 人 第 一 个 本 地 变量 
将 栈 顶 double 型 数值 存 人 第 二 个 本 地 变量 
将 栈 项 double 型 数值 存 人 第 三 个 本 地 变量 
将 栈 顶 double 型 数值 存 人 第 四 个 本 地 变量 
将 乒 项 引用 型 数值 存 人 第 一 个 本 地 变 基 
将 栈 项 引用 型 数值 存 入 第 二 个 本 地 变 其 
将 栈 项 引用 型 数值 存 入 第 三 个 本 地 变节 
将 栈 了 顶 引用 型 数值 存 信 第 四 个 本 地 变量 
将 我 项 int 型 数值 分 人 指定 数组 的 指定 索引 位置 
将 线 顶 long 起 数值 存 人 指定 数组 的 指定 索引 位 痪 
将 栈 顶 Hont 塌 数 值 存 人 指定 数组 的 指定 索引 位 置 
将 栈 顶 double 型 数值 存 人 指定 数组 的 指定 索引 位 置 
将 找 项 引用 型 数值 存 人 指定 数组 的 指定 索引 位 置 
将 栈 硕 boolean 或 byte 型 数值 存 人 指定 数组 的 指定 索引 位 辕 
将 栈 项 char 型 数值 存 人 指定 数组 的 指定 索引 位 置 
将 栈 项 shor 型 数值 存 人 指定 数组 的 指定 索引 位 置 
将 栈 顶 数值 弹出 (数值 不 能 是 long 或 double 类 型 的 ) ) 
将 栈 顶 的 一 个 (对 于 tong 吉 double 类 型 ) 趟 两 个 数值 “对 于 非 long 或 double 


的 其 他 类 型 ) 弹出 


复制 栈 项 数值 并 将 复制 值 压 人 栈 陆 

复制 栈 项 数值 并 将 两 个 复制 值 压 人 栈 项 

复制 栈 项 数值 并 将 三 个 〈 或 两 个 ) 复制 值 奈 入 栈 顶 

复制 栈 顶 一 个 (对 于 long 或 double 类 型 ) 或 两 个 5 对 于 非 long 或 double 的 其 


他 类 型 ) 数值 并 将 复制 值 奈 人 相 顶 


dup_xl 指令 的 双 信 和 舌 本 
dup_x2 指令 的 双 倍 段 本 

将 栈 最 顶端 的 两 个 数值 互 换 (数值 不 能 是 long 或 double 类 型 ) 
将 栈 顶 两 int 型 数值 相 加 并 将 结果 讨 人 栈 顶 
将 找 顶 两 long 型 数值 相 加 并 将 结果 压 人 栈 项 
将 乒 顶 两 float 型 数值 相 加 并 将 结果 压 人 和 栈 琐 
将 生 项 两 double 型 数值 相 加 并 将 结果 压 人 栈 项 
将 栈 顶 两 int 型 数值 相 减 并 将 结果 压 人 栈 顶 

将 栈 顶 两 long 型 数值 相 减 并 将 结果 压 人 栈 顶 
将 栈 吏 两 float 型 数值 相 减 并 将 结果 压 人 乒 顶 
将 栈 珊 两 double 型 数值 相 减 并 将 结果 续 人 本 而 
将 乒 顶 两 int 型 数值 相生 并 将 要 果 压 人 栈 项 
将 栈 顶 两 long 型 数值 相 乘 并 将 结果 讨 人 栈 顶 


助 记 符 


idiv 


fdiv 


2 


ineg 


也 


dneg 


到 


lushr 


总 


下 


指令 含义 
将 栈 预 两 hoat 型 数值 相 洪 并 将 结果 奈 入 栈 现 
将 栈 顶 两 double 型 数值 相 乘 并 将 结果 压 大 栈 顶 
将 栈 顶 两 int 型 数值 相 除 并 将 结果 故人 栈 顶 
将 栈 顶 两 long 型 数值 相 除 并 将 结果 故人 入 栈 顶 
将 栈 症 两 float 型 数值 相 除 并 将 结业 压 和 人 栈 预 
将 栈 顶 两 double 型 数值 相 除 并 将 结 到 压 信 懂 顶 
将 栈 预 两 int 型 数值 作 肥 黎 运 算 并 将 结果 压 人 栈 顶 
将 栈 预 两 long 型 数值 作 取 和 寞 运算 并 将 结果 床 人 栈 顶 
将 栈 顶 两 foat 型 数值 作 了 到 模 运 算 并 将 结果 奈 入 栈 顶 
将 栈 顶 两 double 型 数值 作 取 模 运 算 并 将 结果 压 入 栈 于 
将 栈 顶 int 型 数值 到 负 并 将 结果 压 人 乒 项 
将 栈 顶 long 型 数值 取 负 并 将 结 末 压 人 栈 顶 
将 栈 杆 float 型 数值 取 负 并 将 结 来 压 人 栈 项 
将 复 顶 double 型 数值 吏 负 并 糙 结 果 故 人 栈 顶 
将 int 型 数值 左 移 位 指定 位 数 并 将 关 当 压 人 栈 顶 
将 long 型 数值 堪 移 位 指定 位 数 冯 将 结果 压 人 栈 顶 
将 int 型 数值 右 〈 带 符号 ) 移 位 指定 位 数 并 将 结果 压 人 栈 顶 
将 long 型 数值 右 〔〈 带 符号 ) 移 位 指定 位 数 并 将 缚 果 压 人 栈 项 
将 int 型 数值 右 〈 无 符号 ) 移 位 指定 位 数 并 将 结果 压 人 栈 顶 
糙 long 型 数值 丰 无 符号 ) 移 位 指定 位 数 并 将 结果 压 人 补 项 
糙 栈 项 两 int 型 数值 作 “ 按 位 与 ” 首 将 结果 讨 人 栈 划 
将 乒 顶 两 Iong 型 数值 作 “ 按 位 与 ”并 将 结果 压 人 栈 棉 
将 栈 顶 两 int 型 数值 作 “ 按 位 或 ”并 将 结 果 压 人 栈 列 
将 栈 项 两 long 型 数值 作 “ 按 位 或 ” 阁 将 结果 压 人 栈 预 
将 栈 顶 两 int 型 数值 作 “ 按 位 异 或 ”并 将 结果 压 人 懂 顶 
将 找 硕 两 long 型 数值 作 “ 按 位 异 或 ”并 将 结果 压 估 栈 项 
将 指定 mt 型 变量 增加 指定 值 (如 计 +、i--、it=2 等 ) 
糙 栈 顶 int 起 数值 强制 转换 成 long 现 数 值 并 将 结果 故人 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 Boat 型 数 秆 并 将 缚 果 压 人 栈 项 
特 栈 天 int 型 数值 强制 转换 成 doubie 拒 数 值 若 将 结果 压 人 栈 预 
将 栈 顶 long 卉 数值 强制 转换 成 int 型 数值 并 将 结 朵 奢 人 栈 顶 
将 找 顶 long 异 数 值 强制 转换 成 foat 型 数值 并 将 结果 压 人 栈 项 


将 栈 顶 iong 是 数值 强制 转换 成 double 型 数值 并 将 结果 压 人 栈 下 


将 栈 顶 float 地 数值 强制 转换 成 int 卉 数值 并 将 结果 讨 人 写 项 
将 栈 顶 float 卉 数值 强制 转换 成 long 型 数值 并 将 结果 压 入 栈 顶 


将 线 顶 float 型 数值 强制 转换 成 double 型 数值 并 将 结果 于 人 本 项 


将 栈 顶 double 蜡 数 值 强制 转换 成 int 型 数值 并 将 结果 压 人 栈 顶 


将 栈 顶 double 型 数值 强制 转换 成 long 型 数值 并 将 结果 压 人 栈 顶 


〈 续 ) 


如 


记 


姬 


B 
宁 


dempg 


ifne 


让 iempeq 
让 _icmpne 
if icmplt 


让 impge 


if acmpedq 
if acmpne 
golo 


ST 


Se 


tableswitch 


i 
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指令 含义 
将 后 顶 double 型 数值 强制 转换 成 float 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 byte 型 数值 并 将 结果 压 入 栈 顶 
将 我 顶 int 型 数值 强制 转换 成 char 型 数值 并 将 结果 压 人 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 short 型 数值 并 将 结果 压 人 栈 顶 
比较 栈 项 两 long 型 数值 的 大 小 ， 东 将 结果 (1.0 或 -1) 压 入 栈 顶 
比较 栈 项 两 oat 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 厅 人 栈 顶 ; 当 其 中 一 


个 数值 为 “NaN” 时 ， 将 -1 压 人 栈 顶 


比较 栈 顶 两 Boat 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 压 人 栈 项 ; 当 其 中 一 


个 数值 为 “NaN"” 时， 将 1 卡 人 栈 驴 


比较 乒 项 两 double 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 压 人 乒 顶 ; 当 其 中 
一 个 数值 为 “NaN"” 村 ， 将 -1 庄 人 栈 项 

比较 栈 顶 两 double 型 数值 的 大 小 ， 并 将 结果 (1、0 或 =1) 压 人 栈 顶 ; 当 其 中 
一 个 数值 为 “NaN” 时 ， 将 ! 压 人 栈 顶 

当 栈 项 int 型 数值 等 于 0 时 跳 转 

当 栈 硕 int 型 数值 不 等 于 0 时 跳 转 

当 栈 项 int 型 数值 小 于 0 时 跷 转 

当 栈 顶 int 型 数值 大 于 或 等 于 0 时 就 转 

当 栈 顶 int 型 数值 大 于 0 时 跳 转 

当 栈 项 int 型 数值 小 于 或 等 于 0 时 跳 转 

比较 栈 项 两 int 型 数值 的 大 小 ， 当 结果 等 于 0 时 跳 转 

比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 不 等 于 0 时 跳 转 

比较 栈 项 两 int 型 数值 的 大 小 ， 当 结果 小 于 0 时 跳 转 

比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 大 十 或 等 于 0 时 路 转 

比较 栈 项 两 int 型 数值 的 大 小 ， 当 辣 采 大 于 0 时 跳 转 

比较 栈 弄 两 int 现 数 值 的 大 小 ， 当 结果 小 填 误 等 于 0 时 跳 转 

比较 栈 项 两 引用 栅 数 值 ， 当 结 染 相等 时 跳 转 

比较 栈 项 两 引用 型 数值 ， 当 结业 不 相等 时 跳 转 

无 条 件 跳 转 

跳 转 至 指定 的 16 位 offset 位 置 ， 并 将 jsr 的 下 一 条 指令 地 址 太 入 栈 顶 

返回 至 本 地 变 基 指定 的 index 的 指令 位 敬一 般 与 jsr 或 jsr w 获 合 使 用 ) 

用 于 switeh 条 件 跳 转 ，case 值 连续 《〈 可 变 长 度 指 令 ) 

用 于 switch 条 件 跳 转 ，case 值 不 连 绪 (可 变 长 度 指 令 ) 

从 当前 方法 返回 int 

从 当前 方法 返回 long 

从 当前 方法 返回 float 

从 当前 方法 返回 double 

从 当前 方法 返回 对 象 引用 

从 当前 方法 返回 void 

获 到 指定 类 的 静态 域 ， 并 将 其 值 诗人 栈 顶 


字 节 码 指令 含义 
Oxb3 为 指定 的 类 的 静态 域 赋值 
Oxb4 获取 指定 类 的 实例 域 ， 并 将 其 值 压 人 栈 顶 
0xb5 为 指定 的 类 的 实例 域 赋值 
Oxb6 调用 实例 方法 
Oxb7 调用 超 类 构造 方法 ， 实 例 初始 化 方法 ， 私 有 方法 
Oxb8 调用 静态 方法 
Oxb9 调用 接口 方法 
Oxba 调用 动态 方法 
0xbb new 创建 一 个 对 象 ， 并 将 其 引用 值 压 入 栈 顶 
创建 一 个 指定 的 原始 类 型 (如 int、float、char 等 ) 的 数组 ， 并 将 其 引用 值 压 人 

Oxbe newarray 

栈 项 
0xbd anewarray 创建 一 个 引用 型 “如 类 、 接 口 、 数 组 ) 的 数组 ， 并 将 其 引用 值 压 人 栈 顶 
Oxbe arraylength 获得 数组 的 长 度 值 并 压 人 栈 顶 
Oxbf athrow 将 栈 顶 的 异常 抛 出 
0xc0 checkcast 检验 类 型 转换 ， 检 验 未 通过 将 抛 出 ClassCastException 
Oxcl instanceof 检验 对 象 是 否 是 指定 的 类 的 实例 ， 如 果 是 ， 则 将 1 压 人 栈 顶 ， 否 则 将 0 压 入 栈 顶 
0xc2 monitorenter 获得 对 象 的 锁 ， 用 于 同步 方法 或 同步 块 
Oxc3 monitorexit 释放 对 象 的 锁 ， 用 于 同步 方法 或 同步 块 


Oxc4 wide 扩展 本 地 变量 的 宽度 
创建 指定 类 型 和 指定 维度 的 多 维 数 组 (执行 该 指令 时 ， 操 作 栈 中 必须 包含 各 维 
度 的 长 度 值 ;， 并 将 其 引用 值 压 和 人 栈 顶 
Oxc6 ifnull 为 null 时 跳 转 
0xc7 ifnonnull 不 为 null 时 跳 转 
Oxc8 goto w 无 条 件 跳 转 〔 宽 索引 )》 
Oxc9 jsr_w 跳 转 至 指定 的 32 位 offset 位 置 ， 并 将 jsr_w 的 下 一 条 指令 地 址 压 入 栈 顶 


0xcs multianewarray 


附录 C HotSpot 虚拟 机 主要 参数 表 


本 参数 表 以 JDK 1.6 为 基础 编写 ，JDK 1.6 的 HotSpot 虚 拟 机 有 很 多 非 
稳定 参数 (Unstable Options， 即 以 -XX: 开 头 的 参数 ，JDK 1.6 的 虚拟 机 
中 大 概 有 660 多 个 ) ， 使 用 -XX:+PrintFlagsFinal 参 数 可 以 输出 所 有 参数 
的 名 称 及 默认 值 〈 默 认 不 包括 Diagnostic 和 Experimental 的 参数 ， 如 果 需 
要 ， 可 以 配合 -XX:+UnlockDiagnosticVMOptions/- 
XX:+UnlockExperimentalVMOptions 一 起 使 用 ) ， 下 面 的 各 个 表格 只 包 
含 了 其 中 最 常用 的 《或 在 本 书 中 介绍 到 的 ) 部 分 。 参 数 使 用 的 方式 有 如 
下 3 种 : 


-XX:+<option 之 开启 option 参 数 。 
-XXX:-<option 之 关闭 option 参 数 。 


-XX:<option>=<<value 之 将 option 参 数 的 值 设 置 为 value。 


C.1 内 存 管 理 参 数 


参数 使 用 介绍 


DisableExplicitGC 默认 关闭 忽略 来 自 System.gc(0) 方法 触发 的 垃圾 收集 


ExplicitGCInvokes 默认 关闭 当 收 到 System.gc() 方法 提交 的 垃圾 收集 申请 时 ， 
Concurrent 使 用 CMS 收集 器 进行 收集 


虚拟 机 运行 在 Client 模 式 下 的 默认 值 ， 打 开 此 开 


其 他 模式 关闭 和 


A 默认 关闭 et 使 用 ParNew+Serial Old 的 收集 器 


打开 此 开关 后 ， 使 用 ParNew+CMS+Serial Old 的 
收集 器 组 合 进行 内 存 回 收 。 如 果 CMS 收集 器 出 现 
Concurrent Mode Failure， 则 Serial Old 收集 器 将 作 
为 后 备 收集 器 

虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开 
关 后 ， 使 用 Parallel Scavenge+Serial Old 的 收集 器 组 
合 进行 内 存 回 收 


Client 模式 的 虚拟 机 默认 开启 ， 


UseSerialGC 





UseConcMarkSweepGC 


Server 模式 的 虚拟 机 默认 开 
启 ， 其 他 模式 关闭 


UseParallelGC 





( 续 ) 


En CE 
i 打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel 
UseParallelOldGC 默认 关闭 Old 的 收集 器 组 侣 进行 内 存 回收 
SurvivorRatio 新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 

直接 普 升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 
大 于 这 个 参数 的 对 象 将 直接 在 老年 代 分 配 

晋升 到 老年 代 的 对 象 年 龄 ， 每 个 对 象 在 坚持 过 一 
MaxTenuringThreshold 默认 值 为 15 次 Minor GC 之 后 ， 年 琴 就 增加 1， 当 超过 这 个 参数 
值 时 就 进入 老年 代 

动态 调整 Java 堆 中 各 个 区 域 的 大 小 及 进入 老年 代 
的 年 龄 

是 否 允 许 分 配 担保 失败 ， 即 老年 代 的 剩余 空间 不 
是 以 应 付 新 生 代 的 整个 Eden 和 Survivor 区 的 所 有 对 
象 都 存活 的 极端 情 洗 


PretenureSizeThreshold 无 默认 值 





UseAdaptiveSizePolicy 默认 开启 


JDK 1.5 及 以 前 版 本 默认 关闭 ， 
JDK 1.6 默认 开启 


HandlePromotionFailure 


少 于 或 等 于 8 个 CPU 时 默认 


ParallelGCThreads 值 为 CPU 数量 值 ， 多 于 8 个 时 | 设置 并 行 GC 时 进行 内 存 回收 的 线程 数 
比 CPU 数量 值 小 


GRR 默认 值 为 9 GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 

i a 的 GC 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 

Ee i 设置 GC 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 
MaxGCPauseMillis 无 默认 值 收集 器 时 生效 





CMSlnitiatingOccupancy 默认 值 为 68 设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 
Fraction 垃圾 收集 ， 私 在 使 用 CMS 收集 器 时 生效 
UseCMSCompactAtFull 默认 开 训 设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 
Collection 次 内 存 碎片 整理 ， 仅 在 使 用 CMS 收集 器 时 生效 
CMSFullGCsBefore 设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 
Compaction -次 内 存 碎片 整理 。 仅 在 使 用 CMS 收集 带 时 生效 
ScavengeBeforeFullGC 默认 开启 在 Full GC 发 生 之 前 触发 一 次 Minor GC 


禁止 GC 过 程 无 限制 地 执行 ， 如 果 过 于 频繁 ， 就 直 


UseGCOverheadLimit 默认 开启 闫 并 是 全 oiemory 你 汪 
下- 线程 缓 ; 文中 了 页 > 在 
UseTLAB Server 模式 默认 开启 二 和 爱 冲 区 中 分 配对 象 ， 避 免 分 配 内 
存 时 的 锁定 过 程 
当 X Xms 人 往 时 ， 堆 可 以 动态 收缩 和 扩 
MaxHeapFreeRatio 默认 值 为 70 当 Xmx 值 比 Xms 值 大 时 ， 堆 可 以 动态 收缩 和 起 


展 ， 这 个 参数 控制 当 排 空闲 大 于 指定 比率 时 自动 收缩 


papi We 当 Xmx 值 比 Xms 值 大 时 ， 堆 可 以 动态 收缩 和 扩 
i 展 ， 这 个 参数 控制 当 堆 空间 小 于 指定 比率 时 自动 扩展 


MaxPermSize 大 部 分 情况 下 默认 值 是 64MB 永久 代 的 最 大 值 





C.2 即时 编译 参数 


参数 使 用 介绍 
Client 模式 下 默认 值 是 1500，Server 


CompileThreshold 
模式 下 是 10000 


触发 方法 即时 编译 的 靖 值 

OSR 比率 ， 它 是 OSR 即时 编译 阔 值 计算 公 
式 的 一 个 参数 ， 用 于 代替 BackEdgeThreshold 
参数 控制 回 边 计 数 器 的 实际 溢出 阔 值 
ReservedCodeCacheSize 大 部 分 情况 下 默认 值 是 32MB 即时 编译 器 编译 的 代码 缓存 的 最 大 值 


Client 模式 下 软 认 值 是 933，Server 
模式 下 是 140 


OnStackReplacePercentage 





C.3 ”类 型 加 载 参数 


参数 默认 值 使 用 介绍 
et a 使 用 依赖 StackMapTable 信息 的 类 型 检查 代替 数据 流 分 析 ， 以 加 
UseSplitVerifier 默认 开启 快 字 节 码 校 验 速度 
当 类 型 校 验 失败 时 ， 是 否 允 许 回 到 老 的 类 型 推导 校 验方 式 进行 校 
验 ， 如 果 开启 则 允许 
RelaxAccessControlCheck 默认 关闭 在 校 验 阶段 放松 对 类 型 访问 性 的 限制 


FailOverToOldVerifier 默认 开启 


C.4 多 线程 相关 参数 


Sm ED 
UseSpinning JDK 1.6 默认 开启 ，JDK 1.5 默认 关闭 | 开启 自 旋 锁 以 避免 线程 频繁 挂 起 和 唤醒 
PreBlockSpin 使 用 自 旋 锁 时 默认 的 自 旋 次 数 
UseThreadPriorities 使 用 本 地 线程 优先 级 
UseBiasedLocking 是 否 使 用 偏向 锁 ， 如 果 开启 则 使 用 

江 开 启 


UseF Metl 1 明 开 当 频 繁 反 射 执 行 某 个 方 法 时 ， EE 成 J 入 码 
etastAccessor ethods i 局 四 ~ 4 一 :市 | 









参数 使 用 介绍 
使 用 激进 的 优化 特性 ， 这 些 特 性 一 般 是 具备 
AggressiveOpts JDK 1.6 默认 开启 ，JDK 1.5 默认 关闭 | 正面 和 负面 双重 影响 的 ， 需 要 根据 具体 应 用 特 


点 分 析 才 能 判定 是 否 对 性 能 有 好 处 


es 如 果 可 能 ， 使 用 大 内 存 分 页 ， 这 项 特性 需要 
UseLargePages \ 认 开启 
SeLargePages 默认 开 操作 系统 的 支持 


参数 使 用 介绍 


er 使 用 指定 大 小 的 内 存 分 页 ， 这 项 特性 需要 操 


StringCache 默认 开启 是 否 使 用 字符 串 缓存 ， 开 启 则 使 用 





C.6 调试 参数 


将 CFG 图 信息 输出 到 文件 ， 只 有 DEBUG 版 虚拟 机 才 支 持 此 


ss 


PrintCFGToFile 默认 关闭 


泽 


将 Ideal 图 信息 输出 到 文件 ， 只 有 DEBUG 版 虚拟 机 才 支 持 此 
PrintIdealGraphFile 默认 关闭 oa 


小 
滋 


让 虚拟 机 进 人 诊断 模式 ， 一 些 参数 (如 PrintAssembly) 需要 
在 诊断 模式 中 才能 使 用 
PrintAssembly 默认 关闭 打印 即时 编译 后 的 二 进 制 信息 


UnlockDiagnosticVM Options 默认 关闭 


参数 默认 值 使 用 介绍 
HeapDumpOnOutOf MemoryError 在 发 生 内 存 洲 出 异常 时 是 否 生 成 堆 转 储 快照 ， 关 闭 则 不 生成 
OnOutOfMemoryError 当 虚 拟 机 抛 出 内 存 溢出 异常 时 ， 执 行 指定 的 命令 
OnError 当 虚 拟 机 抛 出 ERROR 异常 时 ， 执 行 指定 的 命令 
PrintClassHistogran es A 0 
PrintConcurrentLocks 打印 JU.C 中 锁 的 状态 
PrintCommandLineFlags 打印 启动 虚拟 机 时 输入 的 非 稳定 参数 
PrintCompilation 打印 方法 即时 编译 信息 
PrintGC 打印 GC 信息 
PrintGCDetails 打印 GC 的 详细 信息 
PrintGCTimeStamps 打印 GC 停顿 耗 时 
PrintTenuringDistribution 打印 GC 后 新 生 代 各 个 年 龄 对 象 的 大 小 
TraceClassLoading 打印 类 加 载 信 息 
TraceClassUnloading 打印 类 外 载 信息 
PrintInlining 打印 方法 的 内 联 信息 

| 默认 关闭 | 





附录 D 对 象 查询 语言 (OQL ) 简介 上 


D.1 SELECT 子 和 名 





SELECT 子 句 用 于 确定 查询 语句 需要 从 堆 转 储 快照 中 选择 什么 内 
容 。 如 果 需 要 显示 堆 转 储 快照 中 的 对 象 ， 并 且 浏 览 这 些 对 象 的 引用 关 
系 ， 可 以 使 用 "*”， 这 与 传统 SQL 语句 中 的 习惯 是 一 致 的 ， 如 ; 








SELECT * FROM Java.lang.String 











1. 选 择 特定 的 显示 列 


查询 也 可 以 选择 特定 的 需要 显示 的 字段 ， 如 : 











SELECT toString (s) , s.count,s.value FROM java.lang.String s 





查询 可 以 用 “@” 符 写 来 使 用 Java 对 象 的 内 存 属性 访问 器 。MAT 提 供 
了 一 系列 的 内 置 函数 来 获取 与 分 析 相 关 的 信息 ， 如 : 











SELECT toString (s) ,§ s.@usedHeapSize,s.Q@retainedHeapSize FROM 
java.lang.String s 





关于 对 象 属性 访问 器 的 具体 内 容 ， 可 以 参见 下 文 的 “属性 访问 器 ”。 


2. 使 用 列 别名 


可 以 使 用 AS 关 键 字 来 对 选择 的 列 进行 命名 ， 如 : 








LECT toString (s) AS Value, 
QusedHeapSize AS"Shallow Size", 
QretainedHeapSize AS"Retained Size" 
ROM Java. angStrings 








pm 
1 

. 

. 





S 
S 
S 
F 





可 以 使 用 "AS RETAINED SET" 关 键 字 来 获得 与 选择 对 象 相 关联 的 
对 象 集合 ， 如 : 











SELECT AS RETAINED SET * FROM java.lang.String 





























3. 拼 合成 为 一 个 对 象 列 表 选 择 项 目 


可 以 使 用 "OBJECTS" 关 键 字 把 SELECT 子 句 中 查找 出 来 的 数据 项 目 
转变 为 对 象 ， 如 : 








SELECT OBJECTS dominators (s) FROM java.lang.String s 




















上 面 例子 中 ， 函 数 "dominators0" 将 会 返回 一 个 对 象 数组 ， 因 此 ， 如 
果 没 有 "OBJECTS" 关 键 字 ， 上 面 的 查询 将 返回 一 组 二 维 的 对 象 数 组 的 列 
表 。 通 过 使 用 关键 字 "OBJECTS"， 我 们 迫使 OQL 把 查询 结果 缩减 为 一 维 
的 对 象 列表 。 


4. 排 除 重 复 对 象 


使 用 "DISTINCT" 关 键 字 可 以 排除 结果 集中 的 重复 对 象 ， 如 : 


























SELECT DISTINCT classof (s) FROM java.lang.String s 





上 上 面 的 例子 中 ， 函 数 "classof()" 的 作用 是 返回 对 象 所 属 的 Java 类 ， 当 
然 ， 所 有 字符 串 对 象 的 所 属 类 都 是 java.lang.String， 因 此 ， 如 果 上 面 的 
查询 中 没有 加 入 DISTINCT 关 键 字 ， 查 询 结 果 就 会 返回 与 快照 中 的 字符 
串 数 量 一 样 多 的 行 记录 ， 并 且 每 行 记录 的 内 容 都 是 java.lang.String 类 
型 。 





[1 本 附录 翻译 自 Eclipse Memory Analyzet Tool (MAT,Eclipse 出 品 的 内 存 


分 析 工具 ) 的 OQL 帮 助 文档 。 


D.2 FROM 子 句 





1.FROM 子 句 指 定 需 要 查询 的 类 


OQL 查 询 需 要 在 FROM 子 句 定义 的 查询 范围 上 进行 操作 。FROM 子 
句 可 以 接受 的 查询 范围 描述 包括 下 列 几 种 方式 : 


1) 通过 类 名 进行 查询 ， 如 : 








SELECT * FROM java.lang.String 














2) 通过 正则 表达 式 匹 配 一 组 类 名 进行 查询 ， 如 : 








SELECT * FROM"java\.lang\..*" 














3) 通过 类 对 和 象 在 堆 转 储 快照 中 的 地 址 进行 查询 ， 如 : 








SELECT * FROM Oxel4al00 














4) 通过 对 象 在 堆 转 储 快照 中 的 ID 进 行 查询 ， 如 : 








SELECT * FROM 3022 














5) 在 子 查 询 中 的 结果 集中 进行 得 询 ， 如 : 























SELECT * FROM (SELECT * FROM java.lang.Class C WHERE c implements 
org.eclipse.mat.snapshot.model.IClass) 





























上 面 的 查询 返回 堆 转 储 快照 中 所 有 实现 
了 "org.eclipse.mat.snapshot.model.IClass" 接 口 的 类 。 下 面 的 这 句 查询 使 用 
属性 访问 器 达到 了 同样 的 效果 ， 它 直接 调用 了 ISnapshot 对 象 的 方法 : 








SELECT * FROM $snapshot.getClasses () 














2 中 合子 类 


使 用 "INSTANCEOF" 关 键 字 把 指定 类 的 子 类 列 入 查询 结果 集 之 中 ， 
如 : 

















SELECT * FROM INSTANCEOF java.lang.ref.Reference 


























这 个 查询 的 结果 集中 将 会 包含 WeakReference、SoftReference 利 
PhantomReference 类 型 的 对 象 ， 因 为 它们 都 继承 自 
java.lang.ref.Reference。 下 面 这 名 查询 也 有 相同 的 结果 : 











SELECT * FROM 
$snapshot.getClassesByName ("java.lang.ref.Reference", true) 
































3. 茶 止 得 询 类 实例 


在 FROM 子 句 中 使 用 "OBJECTS" 关 键 字 可 以 禁止 OQL 把 查询 的 范围 





解释 为 对 象 实例 ， 如 : 








SELECT * FROM OBJECTS java.lang.String 























这 个 查询 的 结果 不 是 返回 快照 中 所 有 的 字符 串 ， 而 是 只 有 一 个 对 
象 ， 也 就 是 java.lang.String 类 对 应 的 Class 对 象 。 


D.3 WHERE 子 句 


1.>>=、<=、>>、<、[NOT]LIKE，[NOTJIN (关系 操作 ) 


WHERE 子 句 用 于 指定 搜索 的 条 件 ， 即 从 得 询 结果 中 删除 不 需要 的 
数据 ， 如 : 














SELECT * FROM java.lang.String s WHERE s.count>=100 

SELECT * FROM java.lang.String s WHERE toString (s) LIKE".*day" 
SELECT * FROM java.lang.String s WHERE s.value NOT IN 
dominators (s) 







































































2.=、!= (等 于 操作 ) 





























SELECT * FROM java.lang.String s WHERE toString (s) ="monday" 





3.AND (条 件 “ 与 ”操作 ) 











SELECT * FROM java.lang.String s WHERE s.count~>100 AND 
s.Q@retainedHeapSize>>s.@usedHeapSize 























4.0R (条件 “或 ”操作 ) 





条 件 “ 或 ?操作 可 以 应 用 于 表达 式 、 和 音量 文本 和 子 得 询 之 中 ， 如 : 


























SELECT * FROM java.lang.String s WHERE s.count 之 1000 OR 
s.value.@length~>>1000 








5. 文 字 表 达 式 


文字 表达 式 包 括 了 布尔 值 、 字 符 串 、 整 型 、 长 整 型 和 null， 如 : 














ELECT * FROM java.lang.String s 
'RE (s.count>1000) =true 











RE 
RE toString (s) ="monday" 
PRE dominators (s) .size()=0 
R 

R 











'RE s.Q@retainedHeapSize>1024L 
'RE s.QGCRootInfo!=null 














马 马 马 三 马 O 
二 I 























D.4 属性 访问 右 


1. 访 问 堆 转 储 快照 中 对 象 的 字段 


对 象 的 内 存 属 性 可 以 通过 传统 的 “点 表示 法 ”进行 访问 ， 格 式 为 : 





[=alias>.]=field 六 .<field>.<=fi 








2. 访 问 Java Bean 属 性 


格式 为 : 





[=alias>.]@<=<attripbute> 





使 用 @ 符 号 ，OQL 可 以 访问 底层 Java 对 象 的 内 存 属 性 。 下 表 列 出 了 


一 些 常 用 的 Java 属 性 。 


目标 


任意 堆 中 对 象 


类 对 象 
任意 数组 





EE 


3. 调 用 OQL Java 方 法 


含义 


快照 中 对 象 的 ID 
快照 中 对 象 的 地 址 


对 象 所 属 的 类 

对 象 的 ShallowSize 
对 象 的 RetainedSize 
对 象 的 显示 名 称 

类 加 载 天 的 ID 
数组 的 长 度 


格式 为 : 





[<alias>>.]6 天 方法 > ([ 雪 表达 式 >>， 扫 表达 式 这 ] ..... 





加 “0” 将 会 令 MAT 解 释 为 一 个 OQL Java 方 法 调用 。 这 个 方法 的 调用 
是 通过 反射 执行 的 。 常 见 的 OQL Java 方 法 如 下 : 


目标 接口 含义 


getClasses() 获取 所 有 类 的 集合 








Ssnapshot Isnapshot setClassesByName(String name,boolean i 
8 获取 指定 类 的 集合 


hasSuperClass() 如 果 对 象 有 父 类 ， 则 返回 true 
Class object Iclass 人 a a 
isArrayType() 如 果 Class 是 数组 类 型 ， 则 返回 true 


includeSubClasses) 








4.0QEL 的 内 建 函数 


格式 为 : 








<function> (<parameter>) 











函数 名 称 作用 
toHex( number ) 以 十 六 进 制 的 形式 打印 数字 
toString( object ) 返回 对 象 的 值 ， 即 使 用 一 个 字符 串 表示 对 象 的 内 容 
dominators( object ) 返回 直接 持 有 指定 对 象 的 对 象 列表 
outbounds( object ) 获取 对 象 的 外 部 引用 
inbounds( object ) 获取 对 象 的 内 部 引用 
classoff object ) 获取 对 象 所 属 的 类 型 对 象 


dominatorof( object ) 返回 直接 持 有 当前 对 象 的 对 象 列表 ， 如 果 没 有 则 返回 -1 


D.5 OOQL 语 言 的 BNE 范 式 


目标 


SelectStatement 


SelectList 


Selectltem 


PathExpression 
EnvVarPathExpression 
ObjectFacet 


ParameterList 


FromClause 


Fromltem 


ClassName 


六 
D 


方法 
"SELECT" SelectList FromClause ( WhereClause )? ( UnionClause )? 


(( "DISTINCT" | "AS RETAINED SET" )? ("*" | "OBJECTS" SelectItem | 
SelectItem ("," SelectItem )* )) 


( PathExpression | EnvVarPathExpression ) ( "AS" ( <STRING LITERAL> | 
<IDENTIFIER> ) ?</IDENTIFIER></STRING LITERAL> 


( ObjectFacet | BuildInFunction ) ( "." ObjectFacet )* 

("$"<IDENTIFIER> )("." ObjectFacet )* 

(("@")?<IDENTIFIER> ( ParameterList )2 ) 

"("((PrimaryExpression ("," PrimaryExpression )* ) )2 ")" 

"FROM" ("OBJECTS" )?° ("INSTANCEOF" (Fromltem | "(" SelectStatement ")" ) 
(<IDENTIFIER> )? 


( ClassName | <STRING LITERAL> | ObjectAddress ( "," ObjectAddress )* | 
Objectld ("," ObjectId )* | EnvVarPathExpression ) 


(<IDENTIFIER> ("." <IDENTIFIER> )* ( "[]" )* ) 


目标 
ObjectAddress 
ObjectId 
WhereClause 
ConditionalOrExpression 
Conditional AndExpression 


EqualityExpression 


RelationalExpression 


<HEX LITERAL> 

<INTEGER LITERAL> 

"WHERE" ConditionalOrExpression 

ConditionalAndExpression ( "or" Conditional AndExpression )* 

EqualityExpression ( "and" EqualityExpression )* 

RelationalExpression ( ( "=" RelationalExpression | "!=" RelationalExpression ) )* 

( PrimaryExpression ( ("<" PrimaryExpression | ">" PrimaryExpression |"<=" 
PrimaryExpression | ">=" PrimaryExpression | ( LikeClause | InClause ) | 


"implements" ClassName ) )? ) 





LikeClause ("NOT" )? "LIKE" <STRING LITERAL> 
InClause ("NOT" )? "IN" PrimaryExpression 
PrimaryExpression Literal 
"(" (ConditionalOrExpression | SubQuery ) ") 
PathExpression 
EnvVarPathExpression 
SubQuery SelectStatement 
i ( ("toHex" | "toString" | "dominators" | "outbounds" | "inbounds" | "classof" | 
"dominatorof" ) "(" ConditionalOrExpression ")" ) 
a (<INTEGER LITERAL> | <LONG LITERAL> | <FLOATING POINT LITERAL> | 
<CHARACTER LITERAL> |<STRING LITERAL> |BooleanLiteral | NullLiteral ) 
BooleanL iteral "true" 
"false" 
NullLiteral <NULL> 


UnionClause 


中 | 


("UNION" "(" SelectStatement ")" )+ 


附录 E JDK 历 史 版 本 轨迹 


大 部 分 的 JDK 历 史 版 本 (JDK 1.1.6 之 后 的 版 本 ) ， 以 及 JDK 所 附带 
的 各 种 工具 的 历史 版 本 ， 都 可 以 从 Oracle 公 司 的 网 站 上 下 载 到 。 


ER TT 
| 
| 
| 


JDK 1.1.3 
JDK 1.1 JDK 1.1.4 
JDK 1.1.5 
JDK 1.1.6 
JDK 1.1.7 
JDK 1.1.8 
JDK 1.2.0 
JDK 1.2 DR 2 
JDK: l22 
JDK 1.3.0 (HotSpot 1.3.0-C) 
JDK 1.3.0 Update 1 (HotSpot 1.3.0 01) 
JDK 1.3.0 Update 2 (HotSpot 1.3.0 02) 
JDK 1.3.0 Update 3 (HotSpot 1.3.0_03) 
JDK 1.3.0 Update 4 (HotSpot 1.3.0 04) 
JDK 1.3.0 Update 5 (HotSpot 1.3.0 05) 
JDK 1.3 JDK 1.3.1 (HotSpot 1.3.1) 
JDK 1.3.1 Update 1 (HotSpot 1.3.1 01) 
JDK 1.3.1 Update la (HotSpot 1.3.1 01a) 
JDK 1.3.1 Update 2 (HotSpot 1.3.1 02) 
JDK 1.3.1 Update 3 (HotSpot 1.3.1 03) 
JDK 1.3.1 Update 4 (HotSpot 1.3.1 04) 
JDK 1.3.1 Update 5 (HotSpot 1.3.1 05) 


Sparkler 1997-09-12 
Pumpkin 1997-12-03 
Abigail 1998-04-24 
Brutus 1998-09-28 
Chelsea 1999-04-08 
Playground 1998-12-04 
(none) 1999-03-30 
Cricket 1999-07-08 
Kestrel 2000-05-08 


Ladybird 2001-05-17 


主 版 本 


JDK 1.3 


JDK 1.4 


子 版 本 及 虚拟 机 版 本 工程 代号 


JDK 1.3.1 Update6 (HotSpot 1.3.1 06) 


( 续 ) 


发 布 日 期 





JDK 1.3.1 Update 7 {HotSpot 1.3.1 07) 








JDK 1.3.1 Update 8 (HotSpot 1.3.1 08) 
JDK 1.3.1 Update 9 ‘(HotSpot 1.3.1 09) 
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